APIXO estandariza parámetros en todos los modelos dentro de cada categoría. Cambia de Flux 2 a Midjourney con cambios mínimos de código — aprende una vez, úsalo en todas partes.
Estructura de la solicitud
Todos los modelos de generación siguen la misma estructura de solicitud:
{
"provider" : "auto" ,
"request_type" : "async" ,
"callback_url" : "https://your-server.com/callback" ,
"input" : {
"mode" : "text-to-image" ,
"prompt" : "your description"
}
}
Parámetros de nivel superior
provider
string
predeterminado: "auto"
Estrategia de enrutamiento. Opciones: auto (mejor equilibrio), value (optimizado por coste), official (proveedor directo).
request_type
string
predeterminado: "async"
Cómo recibir resultados. async para polling, callback para entrega por webhook.
URL del webhook para recibir resultados. Requerido cuando request_type es callback. Debe ser un endpoint HTTPS accesible públicamente.
Parámetros de generación específicos del modelo. La estructura varía según la categoría (imagen, vídeo, audio).
Parámetros de generación de imágenes
Todos los modelos de imagen (Flux 2, Midjourney, GPT Image 1, etc.) comparten estos parámetros input:
mode
string
predeterminado: "text-to-image"
requerido
Modo de generación: text-to-image o image-to-image.
Descripción de texto del resultado deseado. 1–5000 caracteres.
Elementos a evitar en la imagen generada (p. ej., "blurry, low quality").
URLs de imágenes de referencia para modo image-to-image. Máx. 5 imágenes, cada una < 10 MB.
aspect_ratio
string
predeterminado: "1:1"
Proporción de aspecto de salida: 1:1, 4:3, 3:4, 3:2, 2:3, 4:5, 5:4, 9:16, 16:9, 21:9 o auto.
resolution
string
predeterminado: "2K"
Resolución de salida: 1K, 2K o 4K.
output_format
string
predeterminado: "png"
Formato de salida: png (sin pérdidas, mayor) o jpeg (comprimido, menor).
Parámetros de generación de vídeo
Todos los modelos de vídeo (Sora 2, Kling, Veo, etc.) comparten estos parámetros input:
mode
string
predeterminado: "text-to-video"
requerido
Modo de generación: text-to-video o image-to-video.
Descripción de texto del contenido de vídeo deseado.
Elementos a evitar en el vídeo generado (p. ej., "shaky, low quality").
URLs de imágenes de referencia para modo image-to-video.
aspect_ratio
string
predeterminado: "16:9"
Proporción de aspecto de salida: 1:1, 16:9 o 9:16.
resolution
string
predeterminado: "1080p"
Resolución de salida: 480p, 720p o 1080p.
Duración del vídeo en segundos.
sound
boolean
predeterminado: "false"
Si generar audio junto con el vídeo.
Parámetros de generación de audio
Los modelos de audio (Suno) usan estos parámetros input:
Versión de Suno: V4, V4_5, V4_5PLUS o V5.
Letras o descripción de la música deseada.
customMode
boolean
predeterminado: "false"
Activar modo personalizado para control total sobre estilo y letras.
instrumental
boolean
predeterminado: "false"
Generar solo instrumental (sin vocales).
Referencia de proporción de aspecto
Valor Descripción Mejor para 1:1Cuadrado Redes sociales, avatares 16:9Pantalla ancha Vídeo, fondos de escritorio 9:16Vertical Móvil, vídeos cortos 4:3Clásico Fotos tradicionales 3:4Retrato Retratos clásicos 21:9Ultra-ancho Cinemático, banners
Referencia rápida
{
"provider" : "auto" ,
"request_type" : "async" ,
"input" : {
"mode" : "text-to-image" ,
"prompt" : "a serene mountain landscape at sunset" ,
"aspect_ratio" : "16:9" ,
"resolution" : "2K"
}
}
{
"provider" : "auto" ,
"request_type" : "callback" ,
"callback_url" : "https://your-server.com/callback" ,
"input" : {
"mode" : "text-to-video" ,
"prompt" : "a drone shot flying over mountains" ,
"aspect_ratio" : "16:9" ,
"duration" : 10
}
}
{
"provider" : "auto" ,
"request_type" : "async" ,
"input" : {
"mode" : "V4_5PLUS" ,
"prompt" : "upbeat pop song about summer" ,
"customMode" : false ,
"instrumental" : false
}
}
Relacionado