ChatGPT ahora es más rápido y preciso en la creación de imágenes

ChatGPT mejora la opción de generar imágenes e infografías para competir con otras inteligencias artificiales como Gemini.
17 dic 2025 , 16:37
Redacción

Anteriormente ChatGPT ya contaba con generación de imágenes, sin embargo su rendimiento era comparado con otras inteligencias artificiales que generan el mismo contenido de forma más eficaz. OpenAI comunicó que su chat ya puede crear imágenes cuatro veces más rápido que antes, con un nuevo modelo que ha empezado a desplegar este martes 17 de diciembre de 2025, y que introduce el renderizado de texto para crear pósteres e infografías.

Lea: EE. UU.:Los padres de un adolescente que se quitó la vida demandan a OpenAI, creadora de ChatGPT

El nuevo modelo de generación de imágenes integrado en ChatGPT mejora el trabajo de edición para ofrecer a los usuarios resultados que se ajustan mucho más a lo que han solicitado, realizando únicamente los cambios pedidos y manteniendo la coherencia de la imagen en cuanto a iluminación, composición y apariencia.

El renderizado de texto en las imágenes es una de las novedades implementadas

Esta mejora se aprecia sobre todo al trabajar con una imagen cargada y aprovecha otra mejora que introduce el modelo: el seguimiento de instrucciones posteriores con mayor fidelidad. "Esto permite ediciones más precisas, así como composiciones originales más complejas, donde las relaciones entre los elementos se conservan según lo previsto", aseguran desde OpenAI en un comunicado.

Lea más: OpenAI lanza GPT-5, su nuevo modelo de lenguaje con avances en razonamiento y precisión

La tercera novedad que llega con el nuevo modelo es el renderizado de texto en las imágenes. La representación que hace del texto es ahora más precisa, y admite texto denso y con letra pequeña para, por ejemplo, crear un menú, un póster o una infografía.

OpenAI se pone al día con Google

Con esta capacidad, OpenAI se pone al día con Google, que a finales de noviembre lanzó Nano Banana Pro (Gemini 3 Pro Image) que presume de un mayor conocimiento del mundo y una mayor capacidad para renderizar texto con precisión directamente en la imagen, lo que, junto a las capacidades de razonamiento avanzado de Gemini 3, permite crear imágenes con explicaciones, infografías y diagramas.

Lea más: IA: Cuatro preguntas que debemos hacernos antes de usar cualquier herramienta de inteligencia artificial

Sin embargo, OpenAI reconoce que el modelo tiene todavía limitaciones, por ejemplo, en mantener la identidad de cada una de las pernas que aparecen en una foto grupal y en traducciones con algunos idiomas, como el chino, árabe o el hebreo.

Aun así, OpenAI ha destacado el mejor rendimiento de este nuevo modelo de generación de imágenes y su rapidez, ya que ahora es hasta cuatro veces más rápido que su antecesor.

Lea también: ¿Quién tiene más poder en el mundo además del Papa? Así responde la Inteligencia Artificial

El nuevo modelo, con el que OpenAI pretende plantar cara a Nano Banana Pro, está ya disponible en ChatGPT para todos los usuarios y en la API, y el acceso para Business y Enterprise estará disponible más adelante.

TAG RELACIONADOS