腾讯云语音识别新手常见问题_AI解决方案_同尘科技

语音识别 2年前 (2023-05-22) 浏览 100

语音识别如何接入?

语音识别目前支持 API 和 SDK 接入,推荐 SDK 接入,详情可参见 一分钟接入服务端 API 和 一分钟跑通集成 SDK。

语音识别怎么进行功能体验?

可通过微信搜索“腾讯云 AI 语音”小程序,选择语音识别进行体验。也可在 语音识别控制台 功能体验模块,通过上传文件或者 URL 进行体验。详情可参考 体验功能。

语音识别控制台功能体验怎样上传大于 5M 的文件?

可在 语音识别控制台-功能体验 中采用上传音频 URL 方式上传体验,建议音频时长不能大于五个小时

不同使用场景对应的是语音识别哪种服务?

实时语音识别适用于有实时性要求的场景,例如语音输入、语音机器人、会议现场记录等场景。一句话识别适用于对60秒之内的短音频文件进行识别的场景,例如语音短信、语音搜索等场景。录音文件识别适用于语音时间较长、实时性要求低的场景,例如客服质检、视频字幕生成等场景。

支持远场和离线的语音识别吗?

支持离线语音识别,详情可参见 离线SDK文档

语音识别支持中英文混合场景和地方方言吗?

实时语音识别、一句话识别、录音文件识别、录音文件识别极速版和语音流异步识别支持中英文混合识别(使用中文引擎的时候,在少量英文的情况下可以支持中英文混合识别,大量英文可能出现识别率降低的情况),且支持带口音的中文普通话语音识别。实时语音识别、一句话识别、录音文件识别和录音文件识别极速版支持上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话等23种方言的识别。

语音识别支持的输入音频时长是多少?

一句话识别每次调用支持60秒之内的音频。录音文件识别每次调用支持五小时之内的音频。实时语音音频流中每个数据包的音频分片为200ms。

语音识别接口的 HTTP 请求返回鉴权失败?

请用户对照参数表检查自己的参数是否正确上传。如果想快速接入,推荐使用官网提供的 SDK。

语音识别接口会限制音频文件的采样率吗?

接口不会限制,但是采样率不符合标准,会影响到识别效果。

对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

- 0人点赞 -

发表点评 (0条)

not found

暂无评论,你要说点什么吗?