APIXO
音频

MiniMax Voice

MiniMax Voice API 可通过文本描述或单个参考音频片段创建可复用的自定义声音,涵盖了 MiniMax Speech 2.8 的声音设计 API 和声音克隆 API 工作流。

声音设计 API
声音克隆 API
可复用的 voice_id
MP3、M4A、WAV 参考音频
$0.50 / request
MiniMax Voice API custom voice design demo cover

立即开始

使用 MiniMax Voice 创建

正在加载工作区...

MiniMax Voice 使用技巧

MiniMax Voice API:用于声音克隆和自定义声音设计

通过 MiniMax Voice API 示例创建自定义声音,比较设计和克隆工作流,预览生成的音频,并为 MiniMax Speech 2.8 准备 voice_id 工作流。

创建

从一个想法开始

选择模型、调整参数,一站式完成创作。

写下您的想法

描述您想创作的内容。

使用示例

从预设风格开始。

调整外观

快速调整关键设置。

创建

一切就绪,即可生成

保留结果

保存您想再次查看的内容。

重试

更快地生成下一个版本。

MiniMax Voice API 技术规格

当前 MiniMax 自定义声音创建的请求字段和工作流限制。

模式

设计与克隆

克隆输入

恰好 1 个音频 URL

预览输出

可复用的 voice_id(带预览音频)

首次轮询

任务创建后约 10 秒

能力

MiniMax Voice 核心功能

通过文本设计声音

描述您想要的口音、音调、年龄、情感、语速和使用场景,然后试听生成的自定义声音。

通过单个音频片段克隆声音

上传一个纯净的参考音频文件,创建一个可复用的 voice_id,用于后续的文字转语音合成。

可复用的声音工作流

使用 MiniMax Speech 2.8 及返回的 MiniMax voice_id 来构建品牌专属的旁白、智能代理和内容生成流程。

您可以用 MiniMax Voice 构建什么?

品牌声音创建

将 MiniMax Voice API 作为自定义声音 API,为产品视频、新用户引导流程、广告创意和客户支持体验创建风格一致的旁白。

声音克隆 API 工作流

构建受控的声音克隆 API 流程,用户上传一个授权的参考音频片段,预览结果,并复用生成的声音定制工作流。

适用于应用的语音库

为角色、辅导老师、播客主播、客服代理或内部培训产品生成可复用的自定义语音 API 资产。

阅读常见问题

MiniMax Voice 注意事项与常见问题

MiniMax Voice 的设计模式需要提供 voice_id_prefix、prompt 和 preview_text。
MiniMax Voice 的克隆模式需要提供一个可公开访问的参考音频 URL。
voice_id_prefix 必须以字母开头,仅包含字母或数字,且长度至少为 6 个字符。
新创建的自定义声音若后续未使用,可能会在 7 天后失效。
克隆模式应仅用于您有权处理和复制的音频。

支持。MiniMax Voice 支持声音克隆 API 模式,需要提供一个参考音频 URL;同时也支持声音设计 API 模式,仅通过文本描述即可创建声音。

APIXO

在一个地方编写提示词、调整设置并生成您的下一个结果。