Catalogo modelli

Modelli più recenti e popolari

Inizi con i modelli che gli utenti provano per primi, poi cerchi e filtri il catalogo completo per tipo di output o flusso di lavoro.

Seedream 5.0 Pro

seedream

Seedream 5.0 Pro

a partire da $0.045/immagineVisualizza

Google

Gemini Omni

a partire da $0.1/secVisualizza

GPT-Image-2

OpenAI

GPT-Image-2

a partire da $0.03/immagineVisualizza

bytedance

Seedance 2.0

a partire da $0.0573/secVisualizza

Tipo di modello

Tutti67 Immagine18 Video24 Audio3 Testo22

Flusso di lavoro

67 modelli

Visualizzazione del catalogo completo

Seedance 2.0

bytedance

Seedance 2.0

Seedance 2.0 is ByteDance's multimodal video model supporting text-to-video, first-and-last-frames, and omni-reference modes. APIXO exclusive: unlimited concurrency, real-person portrait support, and hidden capabilities.

VideoNuovoPopolariTesto a videoImmagine a video

a partire da $0.0573/secVisualizza

Seedance 2.0 Fast

bytedance

Seedance 2.0 Fast

Seedance 2.0 Fast is the speed-optimized variant of ByteDance's multimodal video model. It supports text-to-video, first-and-last-frames, and omni-reference modes with lower per-second pricing and the same APIXO-exclusive capabilities.

VideoNuovoPopolariTesto a videoImmagine a video

a partire da $0.044/secVisualizza

GPT-Image-2

OpenAI

GPT-Image-2

GPT-Image-2 is OpenAI's next-generation image model for stronger photorealism, cleaner image editing, and sharper in-image text rendering.

ImmagineNuovoPopolariTesto a immagineImmagine a immagine

a partire da $0.03/immagineVisualizza

HappyHorse

Alibaba

HappyHorse

HappyHorse is Alibaba's video generation and editing model for text-to-video, image-to-video, reference-guided generation, and video-edit workflows with 720p/1080p output.

VideoNuovoPopolariTesto a videoImmagine a video

a partire da $0.375/secVisualizza

Flux 2

Black Forest Labs

Flux 2

BFL’s latest Pro & Flex pipelines for text-to-image and image-to-image with unified 1K/2K pricing and ~30s generation.

ImmagineNuovoPopolariTesto a immagineImmagine a immagine

a partire da $0.04/immagineVisualizza

Nano Banana Pro

Google

Nano Banana Pro

Nano Banana Pro is Google's AGI-level image generation model with reasoning capabilities, native 4K output, Search Grounding for real-time data integration, near-perfect text rendering, and superior spatial awareness.

ImmaginePopolariTesto a immagineImmagine a immagine

a partire da $0.14/immagineVisualizza

Midjourney

midjourney

Midjourney

Midjourney is an advanced AI image generation model known for artistic, high-quality outputs. It supports text-to-image, image-to-image, image-edit, Vary, and Upscale workflows.

ImmaginePopolariTesto a immagineImmagine a immagine

a partire da $0.1/immagineVisualizza

Flux Kontext

Black Forest Labs

Flux Kontext

Professional-grade image generation with enhanced prompt understanding and superior quality output.

ImmaginePopolariTesto a immagineImmagine a immagine

a partire da $0.04/immagineVisualizza

GPT-Image-1

OpenAI

GPT-Image-1

GPT-Image-1 is OpenAI's advanced multimodal model for high-quality image generation with natural language understanding.

ImmaginePopolariTesto a immagineImmagine a immagine

a partire da $0.35/immagineVisualizza

Nano Banana

Google

Nano Banana

Gemini 2.5 Flash Image Preview (aka Nano Banana) is an advanced AI model excelling in natural language-driven image generation and editing. It produces hyper-realistic, physics-aware visuals with seamless style transformations.

ImmaginePopolariTesto a immagineImmagine a immagine

a partire da $0.03/immagineVisualizza

Seedream 5.0 Pro

seedream

Seedream 5.0 Pro

Seedream 5.0 Pro is ByteDance's premium single-image model for text-to-image and image-to-image generation, supporting 1K/2K resolution, eight aspect ratios, up to 10 reference images, and strict custom-size control.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.045/immagineVisualizza

bytedance

Seedance 1.5 Pro

Seedance 1.5 Pro is ByteDance's per-second video model for fast text-to-video and image-to-video generation with 480p/720p/1080p output, optional sound, aspect ratio control, and fixed-lens camera stability.

VideoNuovoTesto a videoImmagine a video

a partire da $0.0108/secVisualizza

Google

Gemini Omni

Gemini Omni is Google's multimodal video generation model for creating videos from text, image references, source video, reusable audio assets, and character asset IDs.

VideoNuovoTesto a videoImmagine a video

a partire da $0.1/secVisualizza

Alibaba

Wan 2.7 Image

Wan 2.7 Image is Alibaba's omni-image API for text-to-image, reference-guided image generation, image editing, sequential images, and high-resolution Omni Image Pro workflows.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.03/immagineVisualizza

Wan 2.7

Alibaba

Wan 2.7

Wan 2.7 is Alibaba's video generation and editing model for text-to-video, image-to-video, reference-guided generation, and video-edit workflows with optional audio input and 720p/1080p output.

VideoNuovoTesto a videoImmagine a video

a partire da $0.1/secVisualizza

Wan 2.6

Alibaba

Wan 2.6

Wan 2.6 is Alibaba's multi-mode video generation model for text, image, flash image, reference, and flash reference workflows, with optional audio input and 720p/1080p output.

VideoNuovoTesto a videoImmagine a video

a partire da $0.025/secVisualizza

seedream

Seedream 5.0

Seedream 5.0 is ByteDance's next-generation AI image model with real-time web search, controllable editing, and logical reasoning. It supports text-to-image and image-to-image with 2K/3K resolution, multiple aspect ratios, and up to 14 reference images.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.035/immagineVisualizza

Sora 2 Pro

OpenAI

Sora 2 Pro

Sora 2 Pro is OpenAI’s premium video generation model with higher quality output, supporting text-to-video and image-to-video at 720p and 1080p resolutions with flexible durations of 4, 8, or 12 seconds.

VideoNuovoTesto a videoImmagine a video

a partire da $0.3/secVisualizza

bytedance

Seedance 2.0 Mini

Seedance 2.0 Mini is ByteDance's lightweight multimodal video model for text-to-video, first-and-last-frames, and omni-reference workflows with 480p/720p output.

VideoNuovoTesto a videoImmagine a video

a partire da $0.028/secVisualizza

Alibaba

Wan 2.6 Image

Wan 2.6 Image is Alibaba's text-to-image and image-to-image model with prompt, negative prompt, aspect ratio, batch count, and optional seed control.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.04/immagineVisualizza

Alibaba

Wan 2.5 Image

Wan 2.5 Image is Alibaba's batch-friendly image generation model for text-to-image and image-to-image workflows, defaulting to four generated images per request.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.03/immagineVisualizza

APIXO

Image Upscaler

Image Upscaler is APIXO's single-image enhancement API for 2K, 4K, and 8K upscaling with JPG, PNG, and WEBP output format control.

ImmagineNuovoImmagine a immagine

a partire da $0.01/immagineVisualizza

APIXO

Image Watermark Remover

Image Watermark Remover is APIXO's authorized single-image cleanup API for removing sample marks or overlays from images you own or have permission to process.

ImmagineNuovoImmagine a immagine

a partire da $0.015/immagineVisualizza

kling

Kling 3.0 Turbo

Kling 3.0 Turbo is Kuaishou's fast video generation model for text-to-video and single-image image-to-video workflows with 720p/1080p output and 3-15 second clips.

VideoNuovoTesto a videoImmagine a video

a partire da $0.112/secVisualizza

MiniMax

MiniMax Image 01

MiniMax Image 01 is MiniMax’s text-to-image and image-to-image model with prompt optimization, flexible size control, 1K/2K presets, and up to 9 generated images per task.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.0035/immagineVisualizza

MiniMax

MiniMax Speech 2.8

MiniMax Speech 2.8 is an async text-to-speech API with HD and turbo quality modes, preset voices, custom MiniMax voice_id support, emotion control, pronunciation dictionaries, and multilingual output settings.

AudioNuovoSintesi vocaleTesto a audio

a partire da $0.06/tracciaVisualizza

MiniMax

MiniMax Voice

MiniMax Voice creates reusable custom voice IDs from text-described voice design or a single public reference audio clip, then returns preview audio for validation.

AudioNuovoTesto a audio

a partire da $0.5/tracciaVisualizza

hailuo

Hailuo 2.3

Hailuo 2.3 is Miniax's async video model with standard and pro modes for text-to-video and image-to-video generation. Standard mode supports 6s/10s at 768p, while pro mode returns fixed 5s at 1080p.

VideoNuovoTesto a videoImmagine a video

a partire da $0.336/secVisualizza

hailuo

Hailuo 2.3 Fast

Hailuo 2.3 Fast is Miniax's speed-optimized image-to-video model with standard and pro modes. Standard supports 6s/10s at 768p, while pro returns fixed 6s output at 1080p.

VideoNuovoImmagine a video

a partire da $0.192/secVisualizza

xai

Grok Image

Grok Image is xAI's image generation model for text-to-image and image-to-image workflows with simple aspect-ratio control and async task delivery. Text-to-image returns 6 images per request on APIXO.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.02/immagineVisualizza

Alibaba

Wan 2.2 Animate

Wan 2.2 Animate API is Alibaba's character animation model that combines one source image and one motion video to generate stylized animated outputs with animate/replace behavior.

VideoNuovoEffetti video

a partire da $0.04/secVisualizza

xai

Grok Video

Grok Video is xAI's async video generation model for text-to-video and image-to-video workflows, with optional continuation via task_id + index and style control.

VideoNuovoTesto a videoImmagine a video

a partire da $0.015/secVisualizza

kling

Kling 3.0 Std

Kling 3.0 Std is Kuaishou's standard-quality video generation model with text-to-video, image-to-video, and motion-control modes. It supports clips up to 15 seconds with optional sound generation and flexible aspect ratios.

VideoNuovoTesto a videoImmagine a video

a partire da $0.42/secVisualizza

MeiGen

InfiniteTalk

InfiniteTalk converts one photo plus audio into audio-driven talking or singing avatar videos with precise lip synchronization. Supports up to 10 minutes at 480p or 720p resolution.

VideoNuovoImmagine a video

a partire da $0.03/secVisualizza

Google

Nano Banana 2

Nano Banana 2 is Google’s high-resolution image generation model with 1K/2K/4K output control, 20,000-character prompts, optional Google Search context, and support for up to 14 reference images.

ImmagineNuovoTesto a immagineImmagine a immagine

a partire da $0.072/immagineVisualizza

vidu

Vidu Q3

Vidu Q3 is a per-second video generation model that combines standard and Turbo text-to-video plus image-to-video workflows in one API. It supports single-image animation, first-and-last-frame transitions, optional sound and BGM, and output up to 1080p.

VideoNuovoTesto a videoImmagine a video

a partire da $0.04/secVisualizza

kling

Kling 2.5 Turbo Pro

Kling 2.5 Turbo Pro is Kuaishou's high-speed video model for text-to-video and image-to-video creation. It supports 5-10 second clips, optional tail-frame images, aspect ratio control for text-to-video, plus negative prompts and CFG scale guidance.

VideoNuovoTesto a videoImmagine a video

a partire da $0.3/secVisualizza

Lightricks

LTX-2 19B

LTX-2 19B is Lightricks' open-source 19B diffusion transformer for cinematic video generation. It supports text-to-video and image-to-video workflows, LoRA conditioning, and high-fidelity outputs up to 1080p in the API.

VideoNuovoTesto a videoImmagine a video

a partire da $0.012/secVisualizza

kling

Kling 2.1

Kling 2.1 is Kuaishou's multi-tier video model with Standard, Pro, and Master modes for image-to-video and text-to-video creation. It supports 5-10 second clips, optional tail images for Pro, and aspect ratio control for Master text-to-video.

VideoNuovoTesto a videoImmagine a video

a partire da $0.2/secVisualizza

kling

Kling 2.6

Kling 2.6 is Kuaishou's native audio-visual video model that generates video, speech, sound effects, and ambience in one pass. It supports text-to-audio-visual and image-to-audio-visual creation with Chinese and English voice generation and up to 10-second clips.

VideoNuovoTesto a videoImmagine a video

a partire da $0.3/secVisualizza

Suno V5

suno

Suno V5

Latest Suno text-to-music model that returns two polished songs per call with faster queues and richer vocals.

AudioNuovoTesto a audio

a partire da $0.12/tracciaVisualizza

Claude

Claude Opus 4.8

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $3/1M inputVisualizza

Claude

Claude Opus 4.7

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $3/1M inputVisualizza

Claude

Claude Opus 4.6

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $3/1M inputVisualizza

Claude

Claude Opus 4.5 20251101

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $3/1M inputVisualizza

Claude

Claude Sonnet 4.6

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.8/1M inputVisualizza

Claude

Claude Sonnet 4.5

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.8/1M inputVisualizza

Claude

Claude Sonnet 4.5 20250929

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.8/1M inputVisualizza

Claude

Claude Haiku 4.5 20251001

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.6/1M inputVisualizza

OpenAI

GPT-5.5

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $3/1M inputVisualizza

OpenAI

GPT-5.4

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.5/1M inputVisualizza

OpenAI

GPT-5.4 Mini

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.45/1M inputVisualizza

OpenAI

GPT-5.3-Codex

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.05/1M inputVisualizza

OpenAI

GPT-5.2

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.05/1M inputVisualizza

OpenAI

GPT-5.2-Codex

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.05/1M inputVisualizza

OpenAI

GPT-5 Mini

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.15/1M inputVisualizza

Gemini

Gemini 3.5 Flash

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.9/1M inputVisualizza

Gemini

Gemini 3.1 Pro Preview

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $1.2/1M inputVisualizza

Gemini

Gemini 3.1 Flash Lite Preview

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.15/1M inputVisualizza

Gemini

Gemini 3 Flash Preview

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.3/1M inputVisualizza

Gemini

Gemini 2.5 Pro

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.75/1M inputVisualizza

Gemini

Gemini 2.5 Flash

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.18/1M inputVisualizza

Gemini

Gemini 2.5 Flash Lite

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

da $0.06/1M inputVisualizza

Veo 3.1

Google

Veo 3.1

Google DeepMind’s upgraded AI video model with lite, fast, and quality routes, 4/6/8 second duration control, 720p/1080p/4k output, and multi-image reference workflows.

VideoTesto a videoImmagine a video

a partire da $0.15/secVisualizza

Wan 2.5

Alibaba

Wan 2.5

Wan 2.5 is Alibaba's video generation model for text-to-video and image-to-video workflows, with optional audio input, 480p/720p/1080p output, 5 or 10 second clips, and prompt expansion.

VideoTesto a videoImmagine a video

a partire da $0.05/secVisualizza

Sora 2

OpenAI

Sora 2

Sora 2 is OpenAI’s latest AI video generation model, supporting both text-to-video and image-to-video. It delivers realistic motion, physics consistency, with improved control over style, scene, and aspect ratio—ideal for creative apps and social media content.

VideoTesto a videoImmagine a video

a partire da $0.1/secVisualizza

seedream

Seedream 4.5

Seedream 4.5 is a powerful text-to-image and image-to-image AI model delivering high-quality image generation with support for 2K and 4K resolutions.

ImmagineTesto a immagineImmagine a immagine

a partire da $0.035/immagineVisualizza