腾讯云语音合成Android SDK_AI解决方案_同尘科技

语音合成 2年前 (2023-11-24) 浏览 175

说明当前页面为新版（V2.0.0及以上）SDK 开发文档。新客户可直接按当前文档接入新版 SDK。旧版（V1.5.3版本及以下）开发文档已于2022年9月5日下线。正在使用旧版 SDK 的客户，可前往控制台查看开发文档。新版 SDK 在稳定性、功能健全性、接口自由度等方面都有所优化。我们将继续支持旧版（V1.5.3版本及以下）SDK，但建议正在使用旧版 SDK 的客户及时升级到新版，以获取更好的使用体验。Android SDK 支持模拟器。

开发相关

开发准备

支持 Android 4.1 以上版本 API LEVEL 16，支持手机与平板。合成实时流式语音，需要手机能够连接网络（3/4/5G 或 Wi-Fi 网络等）。建议使用最新版本 Android Studio 进行开发。服务端 API 文档。

下载安装 SDK

语音合成 Android SDK。解压后即是示例代码工程，目录 sdk 下的 aar 文件即 SDK 包。用 Android Studio 打开此工程查看语音合成示例代码。

环境配置

添加实时语音识别 SDK aar 包放在 libs 目录下，在 App 的 build.gradle 文件中添加以下代码。

 implementation(name: 'libqcloudtts-release', ext: 'aar')

在 AndroidManifest.xml 添加如下权限：

接口说明

获得 TTS 合成器实例

//获得实例TtsController mTtsController = TtsController.getInstance();  
//销毁实例TtsController.release();

初始化引擎

//第二个参数固定传入 TtsMode.ONLINE//TtsResultListener: 合成监听器，用于获取合成结果mTtsController.init(Context context,TtsMode.ONLINE,TtsResultListener listener)

合成监听器，用于获取合成结果

实例化 TtsResultListener 时，默认需要重写 onSynthesizeData() 和 onError() 方法。
onSynthesizeData()方法签名说明

参数	说明
byte[] bytes	语音数据
String utteranceId	语句 ID
String text	文本
int engineType	引擎类型；0：在线，1：离线；当前是纯在线 SDK，请忽略此参数

onError()方法签名说明

参数	说明
TtsError error	错误信息，无错误返回 null
String utteranceId	语句 ID（如果有则返回）
String text	文本（如果有则返回）

示例

TtsResultListener listener = new TtsResultListener() {
    @Override    public void onSynthesizeData(byte[] bytes, String utteranceId, String text, int engineType) {        // 您可以在这里将音频保存或者送入播放接口播放，可调用播放器入参接口入参    }
    @Override    public void onError(TtsError error, String utteranceId, String text) {      // 您可以在这里添加错误后处理    }
    @Override    public void onOfflineAuthInfo(QCloudOfflineAuthInfo offlineAuthInfo) {      //离在线SDK保留接口，请忽略，如果您后续升级为离线SDK或者离在线SDK，此接口将用于返回授权信息   }}

合成文本入参接口

接口	说明
synthesize(String text, String utteranceId)	text 为需要合成的文本；utteranceId 为标记该文本的 ID，将随合成结果返回宿主层
synthesize(String text)	text 为需要合成的文本

示例

//内部有维护队列，可持续添加语句，SDK内将依次合成TtsError error = null;//当返回的error不为null时，入参失败error = mTtsController.synthesize("今天天气不错","第1句");error = mTtsController.synthesize("腾讯云语音合成","第2句");error = mTtsController.synthesize("腾讯云AI","第3句");error = mTtsController.synthesize("腾讯云AI","第4句");
//取消未合成的任务并清空内部队列mTtsController.cancel();

TtsController 配置参数方法

接口	说明
setSecretId(String s)	腾讯云安全凭证，获取地址
setSecretKey(String s)	腾讯云安全凭证，获取地址同上
setToken(String s)	若 STS 临时证书鉴权时需要设置 Token，请参见获取联合身份临时访问凭证
setOnlineVoiceSpeed(float f)	语速，范围：[-2，6]，分别对应不同语速：-2代表0.6倍、-1代表0.8倍、0代表1.0倍（默认）、1代表1.2倍、2代表1.5倍、6代表2.5倍。如果需要更细化的语速，可以保留小数点后 2 位，例如0.5/1.25/2.81等。参数值与实际语速转换，可参考代码示例
setOnlineVoiceVolume(float f)	设置在线所合成音频的音量
setOnlineVoiceType(int i)	设置在线所合成音频的音色 ID，完整的音色 ID 列表请参见基础语音合成
setOnlineVoiceLanguage(int i)	主语言类型：1-中文（默认），2-英文
setOnlineCodec(String s)	在线模式编码格式，非业务必要不建议更改：默认 mp3，目前支持 mp3、wav、pcm，如更改为 pcm 不支持播放
setConnectTimeout(int i)	连接超时，范围：[500,30000]，单位ms，默认15000ms
setReadTimeout(int i)	读取超时，范围：[2200,60000]，单位ms，默认30000ms

示例

mTtsController.setSecretId("AKIDs*********LbFHp7");mTtsController.setSecretKey("D9tdAM******Lmxvc2");mTtsController.setOnlineVoiceSpeed(0.0); //配置语速mTtsController.setOnlineVoiceVolume(1.0);//配置音量mTtsController.setOnlineVoiceType(1001); //配置音色id mTtsController.setOnlineVoiceLanguage(1);//配置主语言mTtsController.setOnlineCodec("mp3"); //配置合成格式mTtsController.setConnectTimeout(15 *1000); //连接超时时间mTtsController.setReadTimeout(30 *1000); //读取超时时间

播放接口

初始化播放器

如果 SDK 的内置播放器无法满足您的需求，您也可以使用自己实现的播放器替换。demo 中也额外提供了一份播放器源码，您可以修改播放器逻辑，源代码位于 MediaPlayerDemo.java，与 SDK 内置播放器一致。

//使用SDK中提供的播放器QCloudMediaPlayer mediaPlayer = new QCloudMediaPlayer(new QCloudPlayerCallback() { 
    @Override    public void onTTSPlayStart() {        Log.d(TAG, "开始播放");    }
    @Override    public void onTTSPlayWait() {        Log.d(TAG, "播放完成，等待音频数据");    }
    @Override    public void onTTSPlayResume() {        Log.d(TAG, "恢复播放");    }
    @Override    public void onTTSPlayPause() {        Log.d(TAG, "暂停播放");    }
    @Override    public void onTTSPlayNext(String text, String utteranceId) {        Log.d(TAG, "开始播放: " + utteranceId + "|" + text);    }
    @Override    public void onTTSPlayStop() {        Log.d(TAG, "播放停止，内部队列已清空");    }
    @Override    public void onTTSPlayError(QPlayerError error) {        Log.d(TAG, "播放器发生异常:"+error.getmCode() + ":" + error.getmMessage());    }
    /**     * @param currentWord 当前播放的字符（此为预估值）     * @param currentIndex 当前播放的字符在所在的句子中的下标（此为预估值）     */    @Override    public void onTTSPlayProgress(String currentWord, int currentIndex) {        Log.d(TAG, "onTTSPlayProgress: " + currentWord + "|" + currentIndex);    }});

播放器入参

enqueue()方法签名说明

参数	说明
byte[] bytes	返回音频流，通过传入字节数组播放
File audio	返回音频文件，通过传入文件播放
String text	音频对应的文本
String utteranceId	文本 ID

示例

//通过音频数据入参QPlayerError err = mediaPlayer.enqueue(byte[] bytes,String text,String utteranceId);
//通过音频文件入参QPlayerError err = mediaPlayer.enqueue(File audio,String text,String utteranceId);

暂停、恢复或停止播放

mediaPlayer.PausePlay();mediaPlayer.ResumePlay();mediaPlayer.StopPlay();

客户端错误码

ID	错误码	说明
-100	TTS_ERROR_CODE_UNINITIALIZED	SDK 未初始化
-101	TTS_ERROR_CODE_GENERATE_SIGN_FAIL	签名失败
-102	TTS_ERROR_CODE_NETWORK_CONNECT_FAILED	网络异常
-103	TTS_ERROR_CODE_DECODE_FAIL	Response 解析失败
-104	TTS_ERROR_CODE_SERVER_RESPONSE_ERROR	后端返回失败错误码，详细错误信息请查看后端错误码
-105	TTS_ERROR_CODE_QUEUE_IS_FULL	合成队列已满
-106	TTS_ERROR_CODE_CANCEL_FAILURE	取消失败，请稍后重试
-900	TTS_ERROR_CODE_OFFLINE_NOSUPPORT	当前 SDK 不支持离线合成能力，请使用 TtsMode.ONLINE

服务端错误码

请参考语音合成 API 文档。

对解决方案有疑惑？想了解解决方案收费？联系解决方案专家

腾讯云限时活动1折起，即将结束：马上收藏

同尘科技为腾讯云授权服务中心，购买腾讯云享受折上折，更有现金返利:同意关联，立享优惠

阿里云解决方案也看看？：点击对比阿里云的解决方案

tongchenkeji

这个用户有点懒，什么都没写~

- 0人点赞 -

腾讯云人脸核身E证通小程序接入 (原生 SDK)_AI解决方案_同尘科技

发表点评（0条）

回复：取消回复

提交

暂无评论，你要说点什么吗？

腾讯云语音合成Android SDK_AI解决方案_同尘科技

开发相关

开发准备

下载安装 SDK

环境配置

接口说明

获得 TTS 合成器实例

初始化引擎

合成监听器，用于获取合成结果

合成文本入参接口

TtsController 配置参数方法

播放接口

初始化播放器

播放器入参

暂停、恢复或停止播放

客户端错误码

服务端错误码

- END -

tongchenkeji

- 0人点赞 -

腾讯云人脸核身E证通小程序接入 (原生 SDK)_AI解决方案_同尘科技

腾讯云语音合成Android SDK 基础_AI解决方案_同尘科技

发表点评（0条）

回复：取消回复

微信扫码登录

账号注册

找回密码

腾讯云语音合成Android SDK_AI解决方案_同尘科技

开发相关

开发准备

下载安装 SDK

环境配置

接口说明

获得 TTS 合成器实例

初始化引擎

合成监听器，用于获取合成结果

合成文本入参接口

TtsController 配置参数方法

播放接口

初始化播放器

播放器入参

暂停、恢复或停止播放

客户端错误码

服务端错误码

- END -

tongchenkeji

- 0人点赞 -

腾讯云人脸核身E证通小程序接入 (原生 SDK)_AI解决方案_同尘科技

腾讯云语音合成Android SDK 基础_AI解决方案_同尘科技

相关推荐

腾讯云实时互动教育版产品动态_音视频解决方案_同尘科技

腾讯云多人音视频房间SDK多人音视频房间 SDK 2.0版本发布和推荐升级公告_音视频解决方案_同尘科技

腾讯云多人音视频房间SDKSDK2.0版本升级指引_音视频解决方案_同尘科技

腾讯云实时音视频多人音视频（TUIRoomKit）发布2.0版本 SDK 和推荐升级公告_音视频解决方案_同尘科技

发表点评 （0条） 回复： 取消回复

账号登录

微信扫码登录

账号注册

找回密码

发表点评（0条）

回复：取消回复