腾讯云智能数智人音频制作接口_AI解决方案_同尘科技

腾讯云智能数智人 1年前 (2023-12-20) 浏览 72

接口说明

对输入文本进行试听,需要试听的音色可以通过接口查询 VirtualmanKey 支持的音色查询,部分形象不支持更换音色。

调用协议

HTTPS + JSONPOST     /v2/ivh/videomaker/broadcastservice/ttsHeader   Content-Type: application/json;charset=utf-8

请求参数

参数 类型 必须 说明
TimbreKey string 音色key,当VirtualmanKey为空时TimbreKey不能为空
VirtualmanKey string 定义播报的角色、服装、姿态、分辨率等信息,参数为枚举值,当TimbreKey为空时VirtualmanKey不能为空,默认选取匹配该形象的第一个音色制作音频。
InputSsml string 需要播报的文本内容,支持ssml标签,上限2万字(字数按unicode字符数计算)
Speed float 语速(1.0为正常语速,范围[0.5-1.5],值为0.5时播报语速最慢,值为1.5时播报语速最快)
AudioStorageS3Url string 可传入含鉴权s3协议存储url,音频成品会上传至该url
SampleRate int 采样率,支持24000(24k)和16000(16k),默认24000(24k)
Codec string 音频格式,支持mp3和wav,默认mp3
SentenceMaxWords int 分句的字数上限,字数范围 [0,999],传0或不传时默认值30
SentenceDisplayPunctuation string 分句里需要展示的标点符号,其中,传入特殊字符”0″表示标点符号都不展示,特殊符号”1″(默认取值)表示标点符号全都展示,也可自定义传入需要展示的标点符号
SentenceSplitPunctuation string 需要断句的标点符号,默认取值。;?!………!?
Volume int 音量大小,范围[0,10],对应音量大小。默认为0,代表正常音量,值越大音量越高。
EmotionCategory string 控制合成音频的情感,仅支持多情感音色使用,可选值参考个人资产管理API 4.5音色列表接口。
EmotionIntensity int 控制合成音频情感程度,取值范围为 [50,200],只有 EmotionCategory 不为空时生效。

返回参数

参数 类型 必须 说明
TaskId string 音频制作的任务 ID,携带 TaskId 访问,可获得该视频的制作进度和下载地址。

请求示例

{    "Header": {},    "Payload": {        "VirtualmanKey": "123",        "InputSsml": "你好虚拟主播",        "Speed": 1    }}

返回示例

{    "Header": {        "Code": 0,        "DialogID": "",        "Message": "",        "RequestID": "123"    },    "Payload": {        "TaskId": "123"    }}

对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

- 0人点赞 -

发表点评 (0条)

not found

暂无评论,你要说点什么吗?