腾讯云智能数智人播报数智人视频生成与管理_AI解决方案_同尘科技

腾讯云智能数智人 1年前 (2023-11-29) 浏览 19

播报数智人适用于培训、媒体等多种内容生产场景,面向传媒、资管、教育等行业提供服务,支持定制专属的播报内容。通过使用数智人播报,可以提高人效,降低成本,迁移和复制成本低,受人为的情绪和自然条件影响小,可实现无误差播报。
平台播报数智人模块能力概述:支持2D真人视频制作,可对文本内容、主播设置、视频设置等进行编辑,可对完成制作的视频、音频进行下载。2D真人视频制作区分2D精品形象及2D小样本形象两种形象类型。支持3D数智人视频制作,可对文本内容、主播设置、视频设置等进行编辑,可对完成制作的视频、音频进行下载。
播报音视频模块访问路径:首页 > 场景应用 > 音视频播报,即可在此管理您已制作的音频、视频内容,或是新建音视频播报项目。

一、新建音视频

单击第一个空白加号卡片,选择需要创建音视频播报形象类型,单击新建音视频,即可开始新内容的编辑制作。



二、管理音视频

对已创建的音视频内容,鼠标悬停在相应封面上,即可对该内容进行管理。注意:主账号创建的内容,子账号不可见,且子账号不可操作编辑和删除。子账号创建的内容,主账号可以查看,但不可操作编辑和删除。视频内容包括以下操作:二次编辑:支持对已经编辑好的内容进行修改,二次编辑不改变原视频,会重新生成一份内容。下载视频:支持下载 mp4 格式、webm 格式(仅抠绿形象支持,可输出带透明通道格式)。下载字幕:支持下载 srt 文件。删除视频:从平台移除,不再存储。修改标题:重命名视频标题。复制标题:复制视频标题。

音频内容包括以下操作:二次编辑:二次编辑不改变原视频,会重新生成一份内容。下载音频:默认下载 mp3 格式。删除音频:从平台移除,不再存储。修改标题:重命名音频标题。复制标题:复制音频标题。

三、音视频制作

驱动能力分为文本驱动、原声驱动、变声驱动三种。播报音视频模块支持通过文本驱动、原声驱动两种驱动方式,来制作数智人音频和视频。

驱动方式 能力描述
文本驱动 通过输入文本即可生成口型自动匹配的数智人音视频内容。在文本中插入动作/表情标签,数智人可在对应的位置做出相应的表情和动作。
原声驱动 通过输入音频即可生成口型自动匹配的数智人音视频内容,数智人音色与输入的音频保持一致。
变声驱动 通过输入音频即可生成口型自动匹配的数智人音视频内容,数智人音色与形象设置环节所选音色保持一致。

注意:每个形象支持的驱动方式有差异,详见标准形象相册。

3.1. 文本驱动

选择文本驱动,需要您在选择好数智人的形象、造型、音色、输出设置后,自行输入文本并在文本中按照您的需要插入动作/表情标签、检查多音字读法等,即可根据您的要求合成相应的数智人播报视频,视频将包含根据文本合成的数智人语音。制作完成后,单击生成视频,编辑视频内容名称、选择视频格式,即可开始生成。生成过程一般需要1-10分钟(具体时长视您制作的视频长度及您账号所购的播报并发数而定),待内容封面不再提示等待、正常展示内容后,即可单击下载。



3.2. 音频驱动

选择语音驱动,生成的视频将直接使用上传音频文件来合成视频,无需选择数智人音色。选择语音驱动方式,即可上传用于驱动数智人的音频文件,支持 wav、mp3、wma、m4a、aac等5种格式。其余数智人的造型配置、输出设置,与文本驱动一致。






对解决方案有疑惑?想了解解决方案收费? 联系解决方案专家

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心,购买腾讯云享受折上折,更有现金返利:同意关联,立享优惠

阿里云解决方案也看看?: 点击对比阿里云的解决方案

- 0人点赞 -

发表点评 (0条)

not found

暂无评论,你要说点什么吗?