音频
MiniMax Voice
MiniMax Voice API 可通过文本描述或单个参考音频片段创建可复用的自定义声音,涵盖了 MiniMax Speech 2.8 的声音设计 API 和声音克隆 API 工作流。
声音设计 API
声音克隆 API
可复用的 voice_id
MP3、M4A、WAV 参考音频

立即开始
使用 MiniMax Voice 创建
正在加载工作区...
MiniMax Voice 使用技巧
MiniMax Voice API:用于声音克隆和自定义声音设计
通过 MiniMax Voice API 示例创建自定义声音,比较设计和克隆工作流,预览生成的音频,并为 MiniMax Speech 2.8 准备 voice_id 工作流。
创建
从一个想法开始
选择模型、调整参数,一站式完成创作。
写下您的想法
描述您想创作的内容。
使用示例
从预设风格开始。
调整外观
快速调整关键设置。
创建
一切就绪,即可生成
保留结果
保存您想再次查看的内容。
重试
更快地生成下一个版本。
MiniMax Voice API 技术规格
当前 MiniMax 自定义声音创建的请求字段和工作流限制。
模式
设计与克隆
克隆输入
恰好 1 个音频 URL
预览输出
可复用的 voice_id(带预览音频)
首次轮询
任务创建后约 10 秒
能力
MiniMax Voice 核心功能
通过文本设计声音
描述您想要的口音、音调、年龄、情感、语速和使用场景,然后试听生成的自定义声音。
通过单个音频片段克隆声音
上传一个纯净的参考音频文件,创建一个可复用的 voice_id,用于后续的文字转语音合成。
可复用的声音工作流
使用 MiniMax Speech 2.8 及返回的 MiniMax voice_id 来构建品牌专属的旁白、智能代理和内容生成流程。
您可以用 MiniMax Voice 构建什么?
品牌声音创建
将 MiniMax Voice API 作为自定义声音 API,为产品视频、新用户引导流程、广告创意和客户支持体验创建风格一致的旁白。
声音克隆 API 工作流
构建受控的声音克隆 API 流程,用户上传一个授权的参考音频片段,预览结果,并复用生成的声音定制工作流。
适用于应用的语音库
为角色、辅导老师、播客主播、客服代理或内部培训产品生成可复用的自定义语音 API 资产。
阅读常见问题
MiniMax Voice 注意事项与常见问题
MiniMax Voice 的设计模式需要提供 voice_id_prefix、prompt 和 preview_text。
MiniMax Voice 的克隆模式需要提供一个可公开访问的参考音频 URL。
voice_id_prefix 必须以字母开头,仅包含字母或数字,且长度至少为 6 个字符。
新创建的自定义声音若后续未使用,可能会在 7 天后失效。
克隆模式应仅用于您有权处理和复制的音频。
支持。MiniMax Voice 支持声音克隆 API 模式,需要提供一个参考音频 URL;同时也支持声音设计 API 模式,仅通过文本描述即可创建声音。