IndexTTS2 弹性部署实践

IndexTTS2 概要
Section titled “IndexTTS2 概要”IndexTTS2 是 bilibili 发布的新一代自回归语音合成。能够通过参考音频,自然语言提示,情绪向量控制语音生成。

step 1 创建部署任务:
Section titled “step 1 创建部署任务:”进入共绩算力控制台 -> 弹性部署服务 -> 选择 GPU 型号 (本服务推荐 4090)

Step 2 配置服务:
Section titled “Step 2 配置服务:”下拉到服务配置->自定义服务->镜像 URL ->端口配置 7860
harbor.suanleme.cn/laiaqwq/index-tts:0.3.0

Step 3 部署服务:
Section titled “Step 3 部署服务:”下拉->部署服务

服务依赖较多,模型文件较大部署可能需要较长时间请耐心等待。
运行成功后效果如图

点击链接即可跳转 dome 界面

此时我们选择示例后点击 Synthesize
也可通过 Gradio 自带 api 远程调用相关服务。
文本转语音小案例:
Section titled “文本转语音小案例:”
1.Voice Reference 区域上传参考音频,也可录音或者粘贴上去。
2.在 Text 填入要转语音的文字。
3.点击 Synthesize 开始文字转语音,根据文字长短所需时间从 10 秒到 2 分钟不等。
此外也可通过其他控制方式
四种控制方式分别是
Same as the voice reference 与语音参考相同
Use emotion reference audio 使用情感参考音频
Use emotion vectors 使用情感向量
Use text description to control emotion 使用文字描述来控制情绪
4.推理完成后 Synthesis Result 区域即可试听下载音频。