首页 > AI > AI基础产品 > 语音识别 > 正文

腾讯云语音识别产品动态_AI解决方案_同尘科技

语音识别 2年前 (2023-11-02) 浏览 160

2023年10月

动态名称	动态描述	发布时间	相关文档
实时语音识别支持强制断句参数	实时语音识别支持强制断句参数，能够在连续说话不间断、或噪声不中断的情况下，支持用户配置断句参数将 vad 断开，从而实现强制断句的效果。	2023-10-31	实时语音识别
新上线超级热词功能	当热词权重设置为11时，热词将升级为超级热词，以提升识别准确率。但建议仅将重要且必须生效的热词设置到11，设置过多权重为11的热词将影响整体字准率。	2023-10-30	实时语音识别录音文件识别一句话识别录音文件识别极速版语音流异步识别
Flutter 客户端新增一句话识别和录音文件识别极速版接口	Flutter SDK 客户端新增一句话识别接口、录音文件识别极速版接口。	2023-10-26	Flutter SDK (一句话识别) Flutter SDK (录音文件识别极速版)

2023年09月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持口语转书面语	录音文件识别支持口语转书面语，可对转写结果做复杂的后处理，实现对语气词、重复词过滤的效果。	2023-09-26	录音文件识别

2023年08月

动态名称	动态描述	发布时间	相关文档
客户端 SDK 支持回音消除	iOS/Android 客户端支持回声消除接口，客户可以自行选择开启或关闭。	2023-08-31	一分钟跑通 SDK(iOS）一分钟跑通 SDK (Android)
语音识别产品支持印地语	语音识别产品新增语言能力，新增支持印地语。	2023-08-31	录音文件识别实时语音识别一句话识别录音文件识别极速版语音流异步识别
语音识别产品支持西班牙语	语音识别产品新增语言能力，新增支持西班牙语。	2023-08-03	录音文件识别实时语音识别一句话识别录音文件识别极速版语音流异步识别

2023年07月

动态名称	动态描述	发布时间	相关文档
控制台上线新访问管理	可通过先创建 JSON 策略、再将策略关联用户或用户组的形式完成子账号权限的配置。	2023-07-27	新访问管理
语音识别产品支持阿拉伯语	语音识别产品新增语言能力，新增支持阿拉伯语。	2023-07-18	录音文件识别实时语音识别一句话识别录音文件识别极速版语音流异步识别
官网体验支持录音文件识别	官网体验页面支持上传录音文件识别功能、更全面展示产品能力。	2023-07-13	录音文件识别官网体验

2023年06月

动态名称	动态描述	发布时间	相关文档
ASR+产品系列发布	新上线说话人识别、虚拟号真人判定。说话人识别可用于登录锁、身份核验等场景；虚拟号真人判定可用于智能外呼场景。	2023-06-28	ASR+产品系列

2023年04月

动态名称	动态描述	发布时间	相关文档
离在线语音识别SDK发布	离在线SDK是在离线SDK里支持在线接口，支持离在线混合识别模式，会根据网络情况自动切换离线和在线版本。	2023-04-28	离在线SDK文档

2023年03月

动态名称	动态描述	发布时间	相关文档
语音识别产品支持越南语、马来语、印度尼西亚语、菲律宾语、葡萄牙语、土耳其语	语音识别产品新增语言能力，新增支持越南语、马来语、印度尼西亚语、菲律宾语、葡萄牙语、土耳其语。	2023-03-24	录音文件识别实时语音识别一句话识别录音文件识别极速版语音流异步识别

2023年02月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持情绪识别	录音文件识别接口中配置情绪识别相关参数（EmotionRecognition)后，可实现输出高兴、愤怒、伤心等情绪标签的输出。	2023-02-28	录音文件识别相关接口

2022年12月

动态名称	动态描述	发布时间	相关文档
实时语音识别、录音文件识别极速版、一句话识别支持 QPS/并发叠加包购买。	QPS/并发叠加包可以对现有 QPS/并发进行扩容。	2022-12-26	计费概述退费说明

2022年11月

动态名称	动态描述	发布时间	相关文档
实时语音识别、录音文件识别、一句话识别支持热词增强版	热词增强版可以有效提升热词在识别结果中的命中率，仅适用中文8k 和16k 的引擎。	2022-11-30	录音文件识别实时语音识别一句话识别
实时语音识别、录音文件识别、一句话识别支持中英粤混合模型	中文、英文、粤语可在免切换的情况下进行混合识别。	2022-11-28	录音文件识别实时语音识别一句话识别

2022年10月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持情绪能量值检测和静音时长检测	所有语种引擎支持情绪能量值检测。静音时长检测支持检测本句与上一句之间的静音时长，单位为秒。	2022-10-29	录音文件识别

2022年09月

动态名称	动态描述	发布时间	相关文档
优化8k 引擎下的中文普通话模型	8k_zh（中文8k 引擎）识别率准确率和性能获得了提升，能够更好地适配电话场景	2022-09-27	录音文件识别实时语音识别一句话识别录音文件识别极速版
优化16k 引擎下的多方言模型	16k_zh_dialect（中文16k 多方言引擎）解决了多识别的问题，部分方言的识别准确率明显提升。	2022-09-26	录音文件识别实时语音识别
优化16k 引擎下的多方言模型	16k_zh_dialect（中文16k 多方言引擎）支持话者分离功能。	2022-09-26	录音文件识别

2021年12月

动态名称	动态描述	发布时间	相关文档
语音识别产品支持四川话、武汉话等23种方言	在原有中文普通话、英语、粤语、日语、上海话基础上，新增了四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。	2021-12-03	一句话识别 API录音文件识别 API

2021年02月

动态名称	动态描述	发布时间	相关文档
语音识别发布多款行业模型	实时语音识别支持教育、医疗、游戏、法庭行业模型录音文件识别支持教育、医疗行业模型	2021-02-01	录音文件识别实时语音识别

2021年01月

动态名称	动态描述	发布时间	相关文档
语音识别支持音频格式全面升级	对录音文件识别、实时语音识别支持的格式进行了全面的升级丰富	2021-01-21	腾讯云语音识别产品详细信息
实时语音识别 SDK 全面支持 websocket 协议	实时语音识别服务端、客户端、前端 SDK 都已支持 websocket 协议	2021-01-21	实时语音识别（websocket）
语音流异步识别子产品发布	对直播协议语音流进行识别，准实时返回识别结果，支持音视频场景专用模型，可用于直播流质检等场景	2021-01-15	语音流异步识别任务创建
录音文件识别极速版子产品发布	对较大的录音文件进行极速识别，半实时返回识别结果；可应用于音视频字幕、准实时质检分析场景等场景	2021-01-15	录音文件识别极速版

2020年11月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持自动说话人分离	16k_zh_video 引擎模型支持说话人分离功能上线，电话场景和非电话场景均支持自动分离和指定说话人数分离	2020-11-27	录音文件识别请求

2020年10月

动态名称	动态描述	发布时间	相关文档
ASR 接入层支持 websocket 协议	本接口服务采用 websocket 协议，对实时音频流进行识别，同步返回识别结果，达到“边说边出文字”的效果。	2020-10-10	实时语音识别（websocket）

2020年09月

动态名称	动态描述	发布时间	相关文档
ASR 访问控制	通过腾讯云的 CAM（访问控制）产品实现对 ASR 操作维度和资源维度的权限管理。	2020-09-16	访问管理概述可授权资源类型授权策略语法
语音识别电话场景支持英语模型	语音识别新增电话 8k 英语模型，适用于英语电话场景的语音转文字	2020-09-09	实时语音识别 SDK一句话识别 SDK录音文件识别 SDK
客户端 TRTC 接入实时语音识别技术指引上线	针对有实时音视频与语音识别需求的用户，可通过 TRTC 接入的实时语音识别的方式使用	2020-09-07	TRTC 接入实时语音识别

2020年08月

动态名称	动态描述	发布时间	相关文档
语音识别产品支持上海话方言	语音识别产品提升语言和方言能力，新增支持上海话方言的能力	2020-08-21	实时语音识别 API一句话识别 API录音文件识别 API
语音识别产品支持日语	语音识别产品提升语言和方言能力，新增支持日语的能力	2020-08-04	实时语音识别 API一句话识别 API录音文件识别 API
语音识别产品返回结果中标点符号能力提升	语音识别产品返回结果中标点符号能力升级后增加顿号、问号和叹号的支持	2020-08-01	实时语音识别 SDK一句话 SDK

2020年07月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持3人及以上多说话人分离	电话场景支持单声道2人话者分离，非电话场景支持单声道2-10人话者分离	2020-07-28	录音文件识别请求
实时语音识别支持 OPUS 格式	OPUS 是一个低延时、高保真的适合在网络中传输的开源的语音编码格式，也是目前比较主流的音频流格式，可更好的支持使用该格式的客户接入实时语音识别	2020-07-02	实时语音识别 API实时语音识别 SDK

2020年06月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持时长能力提升	当采用上传音频 url 方式使用录音文件识别时，url 的时长限制由1小时放宽到5小时	2020-06-18	录音文件识别请求录音文件识别 SDK
实时语音识别支持词级别时间戳功能	实时语音识别支持词级别时间戳功能，该功能适用于通过语音识别加载字幕，并且对时延要求较高场景	2020-06-05	实时语音识别 API实时语音识别 SDK

2020年04月

动态名称	动态描述	发布时间	相关文档
支持用户自主对识别结果进行数字转换	支持用户自主选择转换为中文数字还是智能转换为阿拉伯数字	2020-04-24	实时语音识别 API实时语音识别 SDK
录音文件识别产品上线音视频领域模型	对于音视频领域（半远场、带背景音乐）的音频转写，有业界领先的识别精度	2020-04-07	录音文件识别 API录音文件识别 SDK

2020年03月

动态名称	动态描述	发布时间	相关文档
发布语音识别后脏词过滤、语气词过滤和句末标点过滤用户自主选择功能	支持用户根据使用场景自主选择是否过滤脏词、语气词和句末标点	2020-03-16	实时语音识别 API一句话识别 API录音文件识别 API

2020年02月

动态名称	动态描述	发布时间	相关文档
语音识别产品支持通过控制台创建热词	添加热词可以显著提升专有词汇识别准确率	2020-02-25	热词

2020年01月

动态名称	动态描述	发布时间	相关文档
实时语音识别与一句话识别产品价格策略变更	变更后的计费策略是根据用量梯度决定产品价格，用量越多单价越低	2020-01-01	计费策略文档

2019年12月

动态名称	动态描述	发布时间	相关文档
录音文件识别支持云函数接入方式	对于将音频文件存储在腾讯云 COS 上的用户，使用云函数方式接入的方法可明显减少前期的接入开发工作	2019-12-18	使用云函数方式的录音文件识别
语音识别产品上线 Beta 版本自学习模型	支持通过语言模型自学习工具进行定制优化，可有效提高专有领域或行业下的语音识别准确率	2019-12-10	自学习模型
语音识别产品支持预付费的购买方式	腾讯云语音识别 ASR 提供预付费和后付费两种计费模式	2019-12-06	计费概述

2019年11月

动态名称	动态描述	发布时间	相关文档
实时语音识别、一句话识别支持英语和粤语	实时语音识别、一句话识别提升语言和方言能力，新增支持英语和粤语的能力	2019-11-13	实时语音识别一句话识别

对解决方案有疑惑？想了解解决方案收费？联系解决方案专家

腾讯云限时活动1折起，即将结束：马上收藏

同尘科技为腾讯云授权服务中心，购买腾讯云享受折上折，更有现金返利:同意关联，立享优惠

阿里云解决方案也看看？：点击对比阿里云的解决方案

tongchenkeji

这个用户有点懒，什么都没写~

- 0人点赞 -

腾讯云即时通信IMH5_AI解决方案_同尘科技

腾讯云云直播直播录制相关管理规定_音视频解决方案_同尘科技

发表点评（0条）

回复：取消回复

提交

not found

暂无评论，你要说点什么吗？