腾讯云语音识别热词_AI解决方案_同尘科技

语音识别 2年前 (2023-08-30) 浏览 63

腾讯云语音识别服务对于常用词汇的识别效果极佳,但对一些特有的人名、产品名、公司名或者某个领域的专有词汇,例如:品牌名智聆、建筑名滨海大厦、保险领域专业词汇核保、云存储专业词汇存储桶、原创食品名金尊披萨等,可能存在识别准确率降低的情况。对于这些专有词汇,腾讯云语音识别提供了热词功能供用户使用,添加热词可以显著提升通用引擎在这类专有词汇上的识别准确率。

功能介绍

在热词功能中,我们开放了“热词”和“热词增强版”两个能力供客户使用,其中“热词增强版”是我们首创的热词支持形式之一,开启“热词增强版”以后可以极大提升语言模型的识别准确率。两个功能的区别如下:热词:通过在热词表中配置热词,可提升这些热词在模型输出的概率。热词增强版:在使用“热词”功能但效果不显著的情况下(如:部分热词因为同音词过多,即使进行了配置,模型输出的概率变化也不大),使用“热词增强版”可开启同音同调替换的能力,可以极大提升相关热词的输出概率。举例:在热词表中配置热词“蜜制”后,选择开启热词增强版,则与“蜜制”同音同调的“秘制”(mìzhì)的识别结果会被替换成“蜜制”。因此建议客户根据自己的实际情况谨慎开启此功能。热词增强版开启方式请查看 支持范围 中的语音识别子产品各接口文档和参数说明。

支持范围

语音识别基础产品 热词参数 热词增强版参数 支持语种 使用方式
录音文件识别 HotwordId ReinforceHotword 所有中文普通话模型所有英文模型所有粤语模型(包括含中文普通话、英文、粤语的混合模型)请注意:热词增强版仅支持各子产品中的中文普通话模型 支持通过 API直接调用 和 控制台配置 两个方式使用热词
实时语音识别 hotword_id reinforce_hotword
录音文件识别极速版 hotword_id reinforce_hotword
一句话识别 HotwordId ReinforceHotword
语音流异步识别 HotwordId 暂不支持

使用建议

常见的通用词汇不建议加入热词,例如“客户”、“朋友”等词汇,加入过多的通用词汇会降低专有词汇的识别率。热词权重越大,被识别出来的概率越大,热词权重的范围为[1,10]之间的整数。热词的添加可以极大提升识别准确率,是快速提升专有领域词汇的重要途径之一,但是仍可能存在无法正确识别的概率。请首先确认音频的清晰度和质量是否达标,达标的标准是普通人听一遍录音就能正确识别出文字。使用时无需区分热词词性或所属实体类型。热词表在创建时无需关联引擎。

使用限制

默认每个账号最多可创建30个热词表,每个热词表最多可添加1000个热词每个热词最长10个字,不能超出限制(如有超过限制的需求,请使用 自学习模型)。 热词表文件必须为 UTF-8 GBK 编码格式,每行仅添加一个热词和对应权重(热词和权重间用英文符号|隔开),不能包含标点和特殊字符。详见 热词示例。同一个账号最多可以设置1个默认热词表(但最多可以创建30个)。如果在调用语音识别服务时,不进行单独的热词表 ID 设置,则自动生效默认热词表;如果进行单独的热词表 ID 设置,那么将生效单独设置的热词表 ID。

热词生效流程

客户通过 API直接调用 和 控制台配置 两个方式创建热词表并获取热词表 ID产品后端服务将热词表配送至识别层(由后端服务完成,客户无感知)客户发起语音识别请求,并传入热词表 ID(如不传入热词表 ID,则生效默认热词表)识别层根据请求传入的热词表 ID 生效对应的热词表(由后端服务完成,客户无感知)

热词使用方法一:通过API创建并使用

您可以通过调用下述接口,自行对热词进行创建、删除、更新、设置等操作,无需依赖控制台的操作:创建热词表:用户通过本接口添加热词,添加成功后会返回给用户热词表 ID,然后用户可以通过在请求语音识别服务时,对热词参数设置对应的热词表 ID 的方式使用。删除热词表:用户通过本接口进行热词表的删除。下载热词表:用户通过本接口进行热词表的下载,获得词表权重文件形式的 base64 值,文件形式为通过 “|” 分割的词和权重,即 word|weight 的形式。获取热词表:用户根据词表的ID可以获取对应的热词表信息。列举热词表:用户通过该接口,可获得所有的热词表及其信息。设置热词表状态:用户通过该接口可以设置热词表的默认状态。初始状态为0,用户可设置状态为1,即为默认状态。默认状态表示用户在请求识别时,如不设置热词表 ID,则默认使用状态为1的热词表。更新热词表:用户通过本接口进行对应的词表信息更新。对于每个语音识别请求,同时只能有一个热词表起作用,但不同的请求可以使不同的热词表生效。针对不同语音识别子产品的请求说明如下:

语音识别子产品 接口文档连接 接口对应热词参数名 如何定义请求
录音文件识别 https://cloud.tencent.com/document/product/1093/37823 HotwordId 每个 HTTP请求
实时语音识别 https://cloud.tencent.com/document/product/1093/48982 hotword_id 每个音频流
录音文件识别极速版 https://cloud.tencent.com/document/product/1093/52097 hotword_id 每个 HTTP 请求
一句话识别 https://cloud.tencent.com/document/product/1093/35646 HotwordId 每个 HTTP 请求
语音流异步识别 https://cloud.tencent.com/document/product/1093/52061 HotwordId 每个音频流

热词使用方法二:通过控制台配置

1. 新建热词表和热词

(1) 登录 语音识别控制台,单击左侧菜单栏热词,进入热词管理页面,单击新建热词
(2)在弹出页面中填写热词名、热词文件、标签,填写完成后,单击确定即可成功新建热词。热词文件书写要求,可参见 使用限制。说明标签:用于从不同维度对资源分类管理。如现有标签不符合您的要求,可在控制台中 管理标签。 (3)设置热词成功后,单击通过 语音识别 API 或 SDK 测试识别效果。

2. 查看列表

登录 语音识别控制台,单击左侧菜单栏热词,进入热词列表页。在热词列表页,可对热词进行设置默认、更新、下载、删除和编辑标签操作。单击操作列中的对应按钮,即可进行相应的操作。


3. 更新热词

在热词列表中,选择操作 > 更新编辑热词,在弹出页面单击更换文件,文件更换完成后,单击确定即可。


4. 设置默认热词

在热词列表中,选择操作 > 设置默认,在弹出页面中将该热词设置为默认热词。热词设为默认后,调用服务时默认生效,无需进行参数设置。

5. 下载热词

在热词列表中,选择操作 > 下载,可直接下载热词。

6. 删除热词

在热词列表中,选择操作 > 删除,在弹出页面中单击确定,即可删除热词。删除后,热词数据和效果均无法恢复。

7. 编辑标签

在热词列表中,选择操作 > 编辑标签,在弹出页面中设置标签键和标签值,也可同时设置多个标签键和标签值,设置完成后,单击确定即可。


8. 热词示例

可在 语音识别控制台-热词 中单击新建热词上传热词表文件,进行热词添加,热词文件示例如下(无需区分热词词性或所属实体类型):
例如:“孔银”、“聊币玄”、“李朝辉”、“罗倾听”这样的专业词汇,可以参照上述示例添加热词,热词权重越大,识别的效果越好。注意:其中的数字推荐按照发音替换为对应汉字,例如“689元”替换为“六百八十九元”。

对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

- 0人点赞 -

发表点评 (0条)

not found

暂无评论,你要说点什么吗?