APIXO standaryzuje parametry we wszystkich modelach w każdej kategorii. Przełącz z Flux 2 na Midjourney przy minimalnych zmianach kodu — naucz się raz, używaj wszędzie.
Struktura żądania
Wszystkie modele generowania stosują tę samą strukturę żądania:
{
"provider" : "auto" ,
"request_type" : "async" ,
"callback_url" : "https://your-server.com/callback" ,
"input" : {
"mode" : "text-to-image" ,
"prompt" : "your description"
}
}
Parametry najwyższego poziomu
Strategia routingu. Opcje: auto (najlepsza równowaga), value (zoptymalizowane pod koszt), official (bezpośredni dostawca).
Jak otrzymać wyniki. async — polling, callback — dostawa przez webhook.
URL webhook do odbioru wyników. Wymagany, gdy request_type to callback. Musi być publicznie dostępny endpoint HTTPS.
Parametry generowania specyficzne dla modelu. Struktura zależy od kategorii modelu (obraz, wideo, audio).
Parametry generowania obrazów
Wszystkie modele obrazów (Flux 2, Midjourney, GPT Image 1 itd.) współdzielą te parametry input:
mode
string
domyślnie: "text-to-image"
wymagane
Tryb generowania: text-to-image lub image-to-image.
Opis tekstowy żądanego wyniku. 1–5000 znaków.
Elementy do uniknięcia na obrazie (np. "blurry, low quality").
URL-e obrazów referencyjnych dla trybu image-to-image. Maks. 5 obrazów, każdy poniżej 10 MB.
Proporcje wyjścia: 1:1, 4:3, 3:4, 3:2, 2:3, 4:5, 5:4, 9:16, 16:9, 21:9 lub auto.
Rozdzielczość wyjścia: 1K, 2K lub 4K.
Format wyjścia: png (bezstratny, większy) lub jpeg (skompresowany, mniejszy).
Parametry generowania wideo
Wszystkie modele wideo (Sora 2, Kling, Veo itd.) współdzielą te parametry input:
mode
string
domyślnie: "text-to-video"
wymagane
Tryb generowania: text-to-video lub image-to-video.
Elementy do uniknięcia w wygenerowanym wideo (np. "shaky, low quality").
URL-e obrazów referencyjnych dla trybu image-to-video.
Proporcje wyjścia: 1:1, 16:9 lub 9:16.
Rozdzielczość wyjścia: 480p, 720p lub 1080p.
Długość wideo w sekundach.
Czy generować dźwięk wraz z wideo.
Parametry generowania audio
Modele audio (Suno) używają tych parametrów input:
Wersja Suno: V4, V4_5, V4_5PLUS lub V5.
Tekst piosenki lub opis muzyki.
Włącz tryb niestandardowy dla pełnej kontroli nad stylem i tekstem.
Generuj tylko instrumentalnie (bez wokalu).
Referencja proporcji
Wartość Opis Najlepsze dla 1:1Kwadrat Social media, awatary 16:9Szeroki ekran Wideo, tapety desktop 9:16Pionowy Mobile, krótkie wideo 4:3Klasyczny Tradycyjne zdjęcia 3:4Pionowy Klasyczne portrety 21:9Ultra-szeroki Kinowe, banery
Szybka referencja
{
"provider" : "auto" ,
"request_type" : "async" ,
"input" : {
"mode" : "text-to-image" ,
"prompt" : "a serene mountain landscape at sunset" ,
"aspect_ratio" : "16:9" ,
"resolution" : "2K"
}
}
{
"provider" : "auto" ,
"request_type" : "callback" ,
"callback_url" : "https://your-server.com/callback" ,
"input" : {
"mode" : "text-to-video" ,
"prompt" : "a drone shot flying over mountains" ,
"aspect_ratio" : "16:9" ,
"duration" : 10
}
}
{
"provider" : "auto" ,
"request_type" : "async" ,
"input" : {
"mode" : "V4_5PLUS" ,
"prompt" : "upbeat pop song about summer" ,
"customMode" : false ,
"instrumental" : false
}
}
Niektóre modele mają dodatkowe unikalne parametry dla zaawansowanych funkcji. Zobacz dokumentację modeli dla szczegółów.
Powiązane