Skip to content
共绩算力文档中心

IndexTTS2 弹性部署实践

IndexTTS2 是 bilibili 发布的新一代自回归语音合成。能够通过参考音频,自然语言提示,情绪向量控制语音生成。

进入共绩算力控制台 -> 弹性部署服务 -> 选择 GPU 型号 (本服务推荐 4090)

下拉到服务配置->自定义服务->镜像 URL ->端口配置 7860

harbor.suanleme.cn/laiaqwq/index-tts:0.3.0

下拉->部署服务

服务依赖较多,模型文件较大部署可能需要较长时间请耐心等待。

运行成功后效果如图

点击链接即可跳转 dome 界面

此时我们选择示例后点击 Synthesize

也可通过 Gradio 自带 api 远程调用相关服务。

1.Voice Reference 区域上传参考音频,也可录音或者粘贴上去。

2.在 Text 填入要转语音的文字。

3.点击 Synthesize 开始文字转语音,根据文字长短所需时间从 10 秒到 2 分钟不等。

此外也可通过其他控制方式

四种控制方式分别是

Same as the voice reference 与语音参考相同

Use emotion reference audio 使用情感参考音频

Use emotion vectors 使用情感向量

Use text description to control emotion 使用文字描述来控制情绪

4.推理完成后 Synthesis Result 区域即可试听下载音频。