容器化部署 acestep1.5-5Hz-lm-1.7B
ACE-Step 1.5 是一款 开源音乐生成基础模型,由国际 AI 社区共同开发,目标是让任何人都可以轻松利用 AI 创作专业级音乐作品。它区别于传统的音乐生成方案,不仅生成速度快,而且具备强大的音乐连贯性、风格控制和多语言支持。
1. 访问控制台进入弹性部署界面
Section titled “1. 访问控制台进入弹性部署界面”共绩算力控制台:https://console.suanli.cn/dashboard
启动成功后进入 8888 端口 jupyterlab 界面
运行 启动必看必运行 脚本 等待 2 分钟左右模型加载完权重后 点击 7860 端口 对应链接即可开始 webui 服务
2.界面概述
Section titled “2.界面概述”Gradio 界面包含以下主要部分:
- 服务配置 - 模型加载和初始化
- 必需输入 - 任务类型、音频上传和生成模式
- 音乐描述和歌词 - 生成的文本输入
- 可选参数 - BPM、调性、时长等元数据
- 高级设置 - 细粒度的生成控制
- 结果 - 生成的音频播放和管理
3.生成模式
Section titled “3.生成模式”简单模式
简单模式专为快速、基于自然语言的音乐生成设计。
使用方法:
- 在生成模式单选按钮中选择”简单”
- 在”歌曲描述”字段中输入自然语言描述
- 如果不想要人声,可选择勾选”纯音乐”
- 可选择首选人声语言
- 点击 创建样本 生成 caption、歌词和元数据
- 在展开的部分中查看生成的内容
- 点击 生成音乐 创建音频
示例描述:
- “一首适合安静夜晚的柔和孟加拉情歌”
- “欢快的电子舞曲,重低音”
- “忧郁的独立民谣,原声吉他”
- “在烟雾弥漫的酒吧里演奏的爵士三重奏”
随机样本: 点击 �� 按钮加载随机示例描述。
自定义模式
自定义模式提供对所有生成参数的完全控制。
使用方法:
- 在生成模式单选按钮中选择”自定义”
- 手动填写 Caption 和歌词字段
- 设置可选元数据(BPM、调性、时长等)
- 可选点击 格式化 使用 LM 增强您的输入
- 根据需要配置高级设置
- 点击 生成音乐 创建音频
任务类型
text2music(默认)
从文本描述和/或歌词生成音乐。
用例: 基于提示从头创建新音乐。
必需输入: Caption 或歌词(至少一个)
cover
转换现有音频,保持结构但改变风格。
用例: 创建不同风格的翻唱版本。
必需输入:
- 源音频(在音频上传区域上传)
- 描述目标风格的 Caption
关键参数: 音频翻唱强度(0.0-1.0)
- 较高的值保持更多原始结构
- 较低的值允许更多创意自由
repaint
重新生成音频的特定时间段。
用例: 修复或修改生成音乐的特定部分。
必需输入:
- 源音频
- 重绘开始(秒)
- 重绘结束(秒,-1 表示文件末尾)
- 描述期望内容的 Caption
lego(仅 Base 模型)
在现有音频的上下文中生成特定乐器轨道。
用例: 为伴奏添加乐器层。
必需输入:
- 源音频
- 轨道名称(从下拉菜单选择)
- 描述轨道特征的 Caption
可用轨道: vocals、backing_vocals、drums、bass、guitar、keyboard、percussion、strings、synth、fx、brass、woodwinds
extract(仅 Base 模型)
从混音音频中提取/分离特定乐器轨道。
用例: 音轨分离、分离乐器。
必需输入:
- 源音频
- 要提取的轨道名称
complete(仅 Base 模型)
用指定的乐器完成部分轨道。
用例: 自动编排不完整的作品。
必需输入:
- 源音频
- 轨道名称(多选)
- 描述期望风格的 Caption
官方文档:
ACE-Step Gradio 演示用户指南:
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/zh/GRADIO_GUIDE.md
ACE-Step 推理 API 文档:
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/zh/INFERENCE.md
ACE-Step API 客户端文档:
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/zh/API.md
ACE-Step 1.5 终极指南(必读):
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/zh/Tutorial.md
论文: