腾讯云语音识别功能体验_AI解决方案_同尘科技

语音识别 2年前 (2023-06-14) 浏览 87

本文将介绍如何通过 语音识别控制台 体验识别功能,您可以通过直接上传文件或 URL 链接体验录音文件识别功能,也可以通过扫码体验实时语音识别功能。

视频讲解



录音文件识别功能体验

文件来源:支持上传本地文件和 URL 链接两种方式。需要您按照产品详细信息中的 录音文件识别 要求,上传的语音文件大小不超过1GB,时长不能超过5小时音频类别:支持电话和非电话。两种类别音频的推荐位深都为16位。音频类别必须和上传的音频相匹配,才会得到正确的识别结果。若您不知道录音文件的音频属性,可在常见的音频软件中查看(例如 Adobe Audition),也可使用开源命令行工具 FFmpeg 进行查看。电话:手机或座机通话生成的音频,一般采样率默认为8000Hz。非电话:非手机或座机通话生成的音频,推荐的采样率为16000Hz。引擎模型:可根据您实际音频的语言和行业来选择,若您的音频并没有对应行业的引擎模型,建议使用对应语音的通用模型进行识别。结果样式:支持含时间戳和不含时间戳。含时间戳:识别结果带对应语音分片的起止时间。不含时间戳:识别结果是只包含文字。录音文件:选择文件/文件地址。“文件来源”选择本地文件时,单击【选择文件】进行本地文件上传。“文件来源”选择 URL 链接时,需填写语音 URL 的地址。上传完文件后,单击【开始识别】,识别完后,单击【点击下载结果】即可查看语音识别的内容。


实时语音识别功能体验

1. 手机扫码进行实时语音文件识别功能体验。
2. 选择“语音识别”进入功能体验。3. 选择您需要体验的引擎模型。4. 按住按钮进行说话,请在完全按住后再开始说话,说完后再松开按钮。5. 可实时的获取识别结果。

对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

- 0人点赞 -

发表点评 (0条)

not found

暂无评论,你要说点什么吗?