APIXO

Catalogo modelli

Modelli più recenti e popolari

Inizi con i modelli che gli utenti provano per primi, poi cerchi e filtri il catalogo completo per tipo di output o flusso di lavoro.

Flusso di lavoro

57 modelli

Visualizzazione del catalogo completo

Seedance 2.0

bytedance

Seedance 2.0

Seedance 2.0 is ByteDance's multimodal video model supporting text-to-video, first-and-last-frames, and omni-reference modes. APIXO exclusive: unlimited concurrency, real-person portrait support, and hidden capabilities.

VideoNuovoPopolariTesto a videoImmagine a video
a partire da $0.55/secVisualizza
Seedance 2.0 Fast

bytedance

Seedance 2.0 Fast

Seedance 2.0 Fast is the speed-optimized variant of ByteDance's multimodal video model. It supports text-to-video, first-and-last-frames, and omni-reference modes with lower per-second pricing and the same APIXO-exclusive capabilities.

VideoNuovoPopolariTesto a videoImmagine a video
a partire da $0.45/secVisualizza
HappyHorse

Alibaba

HappyHorse

HappyHorse is Alibaba's video generation and editing model for text-to-video, image-to-video, reference-guided generation, and video-edit workflows with 720p/1080p output.

VideoNuovoPopolariTesto a videoImmagine a video
a partire da $0.375/secVisualizza
GPT-Image-2

OpenAI

GPT-Image-2

GPT-Image-2 is OpenAI's next-generation image model for stronger photorealism, cleaner image editing, and sharper in-image text rendering.

ImmagineNuovoPopolariTesto a immagineImmagine a immagine
a partire da $0.03/immagineVisualizza
Flux 2

Black Forest Labs

Flux 2

BFL’s latest Pro & Flex pipelines for text-to-image and image-to-image with unified 1K/2K pricing and ~30s generation.

ImmagineNuovoPopolariTesto a immagineImmagine a immagine
a partire da $0.035/immagineVisualizza
Nano Banana Pro

Google

Nano Banana Pro

Nano Banana Pro is Google's AGI-level image generation model with reasoning capabilities, native 4K output, Search Grounding for real-time data integration, near-perfect text rendering, and superior spatial awareness.

ImmaginePopolariTesto a immagineImmagine a immagine
a partire da $0.14/immagineVisualizza
Midjourney

midjourney

Midjourney

Midjourney is an advanced AI image generation model known for artistic, high-quality outputs. It supports text-to-image, image-to-image, image-edit, Vary, and Upscale workflows.

ImmaginePopolariTesto a immagineImmagine a immagine
a partire da $0.1/immagineVisualizza
Flux Kontext

Black Forest Labs

Flux Kontext

Professional-grade image generation with enhanced prompt understanding and superior quality output.

ImmaginePopolariTesto a immagineImmagine a immagine
a partire da $0.03/immagineVisualizza
GPT-Image-1

OpenAI

GPT-Image-1

GPT-Image-1 is OpenAI's advanced multimodal model for high-quality image generation with natural language understanding.

ImmaginePopolariTesto a immagineImmagine a immagine
a partire da $0.035/immagineVisualizza
Nano Banana

Google

Nano Banana

Gemini 2.5 Flash Image Preview (aka Nano Banana) is an advanced AI model excelling in natural language-driven image generation and editing. It produces hyper-realistic, physics-aware visuals with seamless style transformations.

ImmaginePopolariTesto a immagineImmagine a immagine
a partire da $0.03/immagineVisualizza

Google

Gemini Omni

Gemini Omni is Google's multimodal video generation model for creating videos from text, image references, source video, reusable audio assets, and character asset IDs.

VideoNuovoTesto a videoImmagine a video
a partire da $0.1/secVisualizza

Alibaba

Wan 2.7 Image

Wan 2.7 Image is Alibaba's omni-image API for text-to-image, reference-guided image generation, image editing, sequential images, and high-resolution Omni Image Pro workflows.

ImmagineNuovoTesto a immagineImmagine a immagine
a partire da $0.024/immagineVisualizza
Wan 2.7

Alibaba

Wan 2.7

Wan 2.7 is Alibaba's video generation and editing model for text-to-video, image-to-video, reference-guided generation, and video-edit workflows with optional audio input and 720p/1080p output.

VideoNuovoTesto a videoImmagine a video
a partire da $0.1/secVisualizza
Wan 2.6

Alibaba

Wan 2.6

Wan 2.6 is Alibaba's multi-mode video generation model for text, image, flash image, reference, and flash reference workflows, with optional audio input and 720p/1080p output.

VideoNuovoTesto a videoImmagine a video
a partire da $0.025/secVisualizza

seedream

Seedream 5.0

Seedream 5.0 is ByteDance's next-generation AI image model with real-time web search, controllable editing, and logical reasoning. It supports text-to-image and image-to-image with 2K/3K resolution, multiple aspect ratios, and up to 14 reference images.

ImmagineNuovoTesto a immagineImmagine a immagine
a partire da $0.032/immagineVisualizza
Sora 2 Pro

OpenAI

Sora 2 Pro

Sora 2 Pro is OpenAI’s premium video generation model with higher quality output, supporting text-to-video and image-to-video at 720p and 1080p resolutions with flexible durations of 10 or 15 seconds.

VideoNuovoTesto a videoImmagine a video
a partire da $3/secVisualizza

bytedance

Seedance 1.5 Pro

Seedance 1.5 Pro is ByteDance's per-second video model for fast text-to-video and image-to-video generation with 480p/720p output, optional sound, aspect ratio control, and fixed-lens camera stability.

VideoNuovoTesto a videoImmagine a video
a partire da $0.01/secVisualizza

hailuo

Hailuo 2.3

Hailuo 2.3 is Miniax's async video model with standard and pro modes for text-to-video and image-to-video generation. Standard mode supports 6s/10s at 768p, while pro mode returns fixed 5s at 1080p.

VideoNuovoTesto a videoImmagine a video
a partire da $0.336/secVisualizza

hailuo

Hailuo 2.3 Fast

Hailuo 2.3 Fast is Miniax's speed-optimized image-to-video model with standard and pro modes. Standard supports 6s/10s at 768p, while pro returns fixed 6s output at 1080p.

VideoNuovoImmagine a video
a partire da $0.192/secVisualizza

xai

Grok Image

Grok Image is xAI's image generation model for text-to-image and image-to-image workflows with simple aspect-ratio control and async task delivery.

ImmagineNuovoTesto a immagineImmagine a immagine
a partire da $0.1/immagineVisualizza

Alibaba

Wan 2.2 Animate

Wan 2.2 Animate API is Alibaba's character animation model that combines one source image and one motion video to generate stylized animated outputs with animate/replace behavior.

VideoNuovoEffetti video
a partire da $0.04/secVisualizza

xai

Grok Video

Grok Video is xAI's async video generation model for text-to-video and image-to-video workflows, with optional continuation via task_id + index and style control.

VideoNuovoTesto a videoImmagine a video
a partire da $0.09/secVisualizza

kling

Kling 3.0 Std

Kling 3.0 Std is Kuaishou's standard-quality video generation model with text-to-video, image-to-video, and motion-control modes. It supports clips up to 15 seconds with optional sound generation and flexible aspect ratios.

VideoNuovoTesto a videoImmagine a video
a partire da $0.42/secVisualizza

MeiGen

InfiniteTalk

InfiniteTalk converts one photo plus audio into audio-driven talking or singing avatar videos with precise lip synchronization. Supports up to 10 minutes at 480p or 720p resolution.

VideoNuovoImmagine a video
a partire da $0.15/secVisualizza

Google

Nano Banana 2

Nano Banana 2 is Google’s high-resolution image generation model with 1K/2K/4K output control, 20,000-character prompts, optional Google Search context, and support for up to 14 reference images.

ImmagineNuovoTesto a immagineImmagine a immagine
a partire da $0.072/immagineVisualizza

vidu

Vidu Q3

Vidu Q3 is a per-second video generation model that combines standard and Turbo text-to-video plus image-to-video workflows in one API. It supports single-image animation, first-and-last-frame transitions, optional sound and BGM, and output up to 1080p.

VideoNuovoTesto a videoImmagine a video
a partire da $0.036/secVisualizza

kling

Kling 2.5 Turbo Pro

Kling 2.5 Turbo Pro is Kuaishou's high-speed video model for text-to-video and image-to-video creation. It supports 5-10 second clips, optional tail-frame images, aspect ratio control for text-to-video, plus negative prompts and CFG scale guidance.

VideoNuovoTesto a videoImmagine a video
a partire da $0.3/secVisualizza

Lightricks

LTX-2 19B

LTX-2 19B is Lightricks' open-source 19B diffusion transformer for cinematic video generation. It supports text-to-video and image-to-video workflows, LoRA conditioning, and high-fidelity outputs up to 1080p in the API.

VideoNuovoTesto a videoImmagine a video
a partire da $0.012/secVisualizza

kling

Kling 2.1

Kling 2.1 is Kuaishou's multi-tier video model with Standard, Pro, and Master modes for image-to-video and text-to-video creation. It supports 5-10 second clips, optional tail images for Pro, and aspect ratio control for Master text-to-video.

VideoNuovoTesto a videoImmagine a video
a partire da $0.2/secVisualizza

kling

Kling 2.6

Kling 2.6 is Kuaishou's native audio-visual video model that generates video, speech, sound effects, and ambience in one pass. It supports text-to-audio-visual and image-to-audio-visual creation with Chinese and English voice generation and up to 10-second clips.

VideoNuovoTesto a videoImmagine a video
a partire da $0.3/secVisualizza
Suno V5

suno

Suno V5

Latest Suno text-to-music model that returns two polished songs per call with faster queues and richer vocals.

AudioNuovoTesto a audio
a partire da $0.12/tracciaVisualizza

Claude

Claude Opus 4.8

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $3/1M inputVisualizza

Claude

Claude Opus 4.7

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $3/1M inputVisualizza

Claude

Claude Opus 4.6

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $3/1M inputVisualizza

Claude

Claude Opus 4.5 20251101

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $3/1M inputVisualizza

Claude

Claude Sonnet 4.6

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.8/1M inputVisualizza

Claude

Claude Sonnet 4.5

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.8/1M inputVisualizza

Claude

Claude Sonnet 4.5 20250929

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.8/1M inputVisualizza

Claude

Claude Haiku 4.5 20251001

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.6/1M inputVisualizza

OpenAI

GPT-5.5

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $3/1M inputVisualizza

OpenAI

GPT-5.4

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.5/1M inputVisualizza

OpenAI

GPT-5.4 Mini

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.45/1M inputVisualizza

OpenAI

GPT-5.3-Codex

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.05/1M inputVisualizza

OpenAI

GPT-5.2

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.05/1M inputVisualizza

OpenAI

GPT-5.2-Codex

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.05/1M inputVisualizza

OpenAI

GPT-5 Mini

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.15/1M inputVisualizza

Gemini

Gemini 3.5 Flash

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.9/1M inputVisualizza

Gemini

Gemini 3.1 Pro Preview

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $1.2/1M inputVisualizza

Gemini

Gemini 3.1 Flash Lite Preview

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.15/1M inputVisualizza

Gemini

Gemini 3 Flash Preview

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.3/1M inputVisualizza

Gemini

Gemini 2.5 Pro

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.75/1M inputVisualizza

Gemini

Gemini 2.5 Flash

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.18/1M inputVisualizza

Gemini

Gemini 2.5 Flash Lite

Gateway compatibile con OpenAI per chat, agenti, ragionamento e generazione strutturata.

API LLM
da $0.06/1M inputVisualizza
Wan 2.5

Alibaba

Wan 2.5

Wan 2.5 is Alibaba's video generation model for text-to-video and image-to-video workflows, with optional audio input, 480p/720p/1080p output, 5 or 10 second clips, and prompt expansion.

VideoTesto a videoImmagine a video
a partire da $0.04/secVisualizza
Veo 3.1

Google

Veo 3.1

Google DeepMind’s upgraded AI video model for realistic motion generation, extended clip duration, multi-image reference control, and synchronized audio output in native 1080p.

VideoTesto a videoImmagine a video
a partire da $0.2/secVisualizza
Sora 2

OpenAI

Sora 2

Sora 2 is OpenAI’s latest AI video generation model, supporting both text-to-video and image-to-video. It delivers realistic motion, physics consistency, with improved control over style, scene, and aspect ratio—ideal for creative apps and social media content.

VideoTesto a videoImmagine a video
a partire da $0.2/secVisualizza

seedream

Seedream 4.5

Seedream 4.5 is a powerful text-to-image and image-to-image AI model delivering high-quality image generation with support for 2K and 4K resolutions.

ImmagineTesto a immagineImmagine a immagine
a partire da $0.04/immagineVisualizza