La API de GPT-Image-2 ya está disponible

Ver modelo
Imagen

GPT-Image-2

GPT Image 2 es el modelo de imagen de próxima generación de OpenAI para un fotorrealismo más sólido, edición más limpia, renderizado de texto más nítido y visuales comerciales pulidos.

$0.03 / image

Texto a imagen + imagen a imagenEntrega asíncronaPrompt de hasta 20,000 caracteres11 relaciones de aspecto
Tipo de modelo

Parámetros

Salida

El contenido generado aparecerá aquí

Ejemplos de salida

Generado con la API GPT-Image-2 en APIXO

Ecommerce Product Hero

Ecommerce Product Hero

Ver
Anime Film Poster

Anime Film Poster

Ver
Fuji Film Couple Portrait

Fuji Film Couple Portrait

Ver
Forbes Cat Cover

Forbes Cat Cover

Ver

Descripción general del modelo

¿Qué es GPT Image 2?

GPT Image 2 es el modelo de imagen actualizado de OpenAI, diseñado para equipos que necesitan un mejor realismo visual y un renderizado de texto más sólido que los sistemas básicos de texto a imagen.

Combina la generación basada solo en prompts con la edición de imagen a imagen, lo que lo hace práctico tanto para la ideación como para los flujos de trabajo de producción en diseño, comercio electrónico y marketing.

Por qué los equipos están actualizando desde las API de imagen de primera generación

  • Mejor cumplimiento del prompt para la composición, iluminación y dirección de estilo.
  • Renderizado de texto más confiable en pósteres, portadas y gráficos promocionales.
  • Detalles más limpios en rostros, productos y superficies de materiales en escenas comerciales.
  • Transiciones más fluidas desde la generación de conceptos hasta la edición basada en referencias.

Patrones de integración para flujos de producción reales

Para herramientas interactivas, comience con el sondeo asíncrono y muestre actualizaciones de progreso en la interfaz de usuario.

Para trabajos de backend de alto volumen, cambie al modo callback en su capa de servicio para reducir la sobrecarga de sondeo y simplificar la orquestación de colas.

Especificaciones técnicas de la API de GPT Image 2

Capacidades actuales de la API y restricciones relevantes para la integración.

Modos

Texto a imagen e imagen a imagen

Entradas de referencia

Hasta 16 URLs de imagen

Latencia típica

40–120 segundos

Entrega

Sondeo asíncrono o webhook de callback

Capacidades clave

Mayor fotorrealismo

Genere una iluminación más limpia, una respuesta de materiales más natural y detalles de sujetos más definidos para visuales listos para producción.

Edición de imagen confiable

Use el modo imagen a imagen para transformar referencias conservando la composición principal y la intención visual.

Texto más nítido en imágenes

Renderice titulares, etiquetas y textos de diseño de forma más confiable para pósteres, tarjetas sociales y creatividades de producto.

Flujo de trabajo de diseño amigable

Soporta la ideación impulsada por prompts y el refinamiento guiado por referencias en la misma interfaz de API.

¿Qué puede construir?

Activos de marketing de producto

Cree tomas principales para comercio electrónico, creatividades para anuncios pagados y visuales clave de campaña con composición y calidad consistentes.

Contenido de marca para redes sociales

Genere visuales para redes sociales a gran escala con calidad predecible para lanzamientos, anuncios y publicaciones recurrentes.

Diseño editorial y de pósteres

Produzca diseños estilo póster y arte editorial que requieran texto legible y una jerarquía visual sólida.

Edición creativa guiada por referencia

Suba imágenes existentes y dirija el estilo, el tono y el encuadre del resultado mediante instrucciones de prompt.

Notas y limitaciones

  • El playground utiliza sondeo asíncrono por defecto. El webhook de callback está disponible a nivel de API para flujos de trabajo de backend.
  • El modo imagen a imagen requiere al menos una URL de imagen de referencia.
  • Se admite un máximo de 16 URLs de imágenes de referencia en el modo imagen a imagen.
  • El tiempo de generación típico es de 40 a 120 segundos; la estrategia de tiempo de espera debe permitir hasta 10 minutos.
  • Todas las solicitudes deben cumplir con las políticas de seguridad y moderación.

Preguntas frecuentes

Comenzar a construir

Pruebe el playground arriba y luego pase a la documentación de la API cuando esté listo para integrar.