ChatGPT Images 2.0 vs Gemini Nano: ¿Cuál genera mejores imágenes?

by Editor de Tecnologia

ChatGPT Images 2.0 vs. Gemini Nano Banana: ¿Cuál genera imágenes con mayor precisión en pruebas cotidianas?

La carrera por dominar la generación de imágenes con inteligencia artificial sigue acelerándose. En las últimas semanas, OpenAI lanzó ChatGPT Images 2.0, una versión mejorada de su modelo de creación visual, mientras que Google actualizó su competidor, Gemini Nano Banana. Para evaluar cuál de los dos ofrece mejores resultados en situaciones reales, el editor senior de tecnología David Gewirtz, de ZDNET, realizó una serie de pruebas comparativas con nueve prompts cotidianos. Los resultados revelaron diferencias clave en precisión, manejo de texto y adaptabilidad a instrucciones complejas.

From Instagram — related to Gemini Nano Banana, David Gewirtz
Ejemplo de generación de imágenes con texto integrado, donde ChatGPT Images 2.0 demostró mayor precisión en la renderización de caracteres.

Metodología de las pruebas

Gewirtz diseñó un conjunto de pruebas basadas en escenarios comunes para usuarios, que incluyeron:

  • Generación de imágenes con texto integrado (ej.: carteles, memes o diseños con frases).
  • Recreación de personajes de cultura pop con descripciones detalladas.
  • Escenas complejas con múltiples elementos y relaciones espaciales (ej.: «un gato usando gafas de sol en una playa al atardecer»).
  • Adaptación a estilos artísticos específicos (ej.: «pintura al óleo en estilo impresionista»).

En diciembre de 2025, Gemini Nano Banana había superado a ChatGPT en estas pruebas con un 93% de precisión, frente al 74% de su competidor. Sin embargo, Gewirtz decidió repetir las pruebas con las versiones actualizadas de ambos modelos para evaluar su evolución.

Resultados: ChatGPT Images 2.0 toma la delantera

Los hallazgos más destacados de la comparación fueron:

Resultados: ChatGPT Images 2.0 toma la delantera
Images Mientras

1. Renderización de texto

ChatGPT Images 2.0 mostró una mejora significativa en la generación de texto dentro de las imágenes. Mientras que Nano Banana cometía errores frecuentes en la ortografía o el espaciado de caracteres, la versión de OpenAI logró mantener la coherencia incluso en frases largas o con fuentes poco convencionales. Este avance es especialmente relevante para diseñadores o creadores de contenido que necesitan integrar texto en sus composiciones visuales.

leer más  Exoplanetas: Descubrimientos y la búsqueda de nuevos mundos

https://youtube.com/watch?v=AbCdEfGhIjK%22+width%3D%22560%22+height%3D%22315%22+frameborder%3D%220%22+allowfullscreen%3D%22allowfullscreen

ChatGPT Images VS Gemini Nano Banana Pro: Which is BETTER?

Video comparativo de la generación de texto en ambos modelos.

2. Fidelidad a los prompts

Uno de los puntos débiles de Nano Banana fue su tendencia a ignorar o malinterpretar partes clave de las instrucciones. Por ejemplo, al solicitar «un dragón con escamas azules y alas de murciélago en un bosque nevado», el modelo de Google a veces omitía elementos como el colour de las escamas o el entorno. ChatGPT Images 2.0, en cambio, demostró mayor disciplina al seguir las indicaciones al pie de la letra, incluso en prompts con múltiples condiciones.

3. Privacidad y personalización

Un aspecto que generó controversia en las pruebas fue la función de personalización de Gemini Nano Banana. El modelo de Google intentó adaptar las imágenes a preferencias supuestamente inferidas del usuario, como incluir rostros reconocibles o estilos artísticos basados en búsquedas previas. Esto planteó preocupaciones sobre el uso de datos personales sin consentimiento explícito, un problema que no se observó en ChatGPT Images 2.0.

¿Por qué importa esta comparación?

Más allá de la competencia entre gigantes tecnológicos, estas pruebas reflejan un avance crucial en la utilidad práctica de la IA generativa. ChatGPT Images 2.0 no solo mejora en aspectos técnicos como la renderización de texto, sino que también ofrece mayor transparencia en su funcionamiento, un factor clave para usuarios profesionales que dependen de estas herramientas en entornos laborales.

Sin embargo, Gewirtz advierte que ninguno de los dos modelos es perfecto. Ambos aún cometen errores en escenas con perspectivas complejas o en la representación de manos y rostros humanos, un desafío recurrente en la generación de imágenes con IA. Además, la brecha entre lo que prometen los anuncios de las empresas y lo que realmente entregan sigue siendo un tema de debate en la industria.

El contexto: ¿Por qué OpenAI lanzó un nuevo modelo de imágenes?

El lanzamiento de ChatGPT Images 2.0 llega en un momento en que OpenAI ha reorientado sus esfuerzos en generación visual. En febrero de 2026, la compañía canceló el desarrollo de Sora, su ambicioso modelo de generación de video, para enfocarse en mejorar las capacidades de su herramienta de imágenes. Según fuentes citadas por CNET, esta decisión respondió a la necesidad de priorizar aplicaciones con mayor demanda inmediata, como la creación de gráficos para redes sociales, presentaciones o prototipos de diseño.

El contexto: ¿Por qué OpenAI lanzó un nuevo modelo de imágenes?
Images Mientras Esto

La apuesta parece estar dando resultados. Mientras que en 2025 la generación de imágenes con IA era vista como un juguete para creativos, hoy herramientas como ChatGPT Images 2.0 están siendo adoptadas por profesionales en campos como el marketing, la educación y el desarrollo de productos. Esto ha reavivado el debate sobre el impacto de la IA en industrias creativas, con algunos diseñadores gráficos expresando preocupación por la posible automatización de sus trabajos.

Debate sobre el impacto de la IA en el diseño gráfico
La discusión sobre si la IA reemplazará a los diseñadores gráficos sigue abierta.

Conclusión: ¿Cuál elegir?

Los resultados de las pruebas sugieren que ChatGPT Images 2.0 es la opción más confiable para usuarios que buscan precisión y consistencia, especialmente en tareas que involucran texto o instrucciones detalladas. Por otro lado, Gemini Nano Banana podría seguir siendo relevante para quienes priorizan la integración con otros servicios de Google o buscan experimentar con funciones de personalización, aunque con reservas sobre la privacidad.

Lo que está claro es que la generación de imágenes con IA ha dejado de ser una curiosidad tecnológica para convertirse en una herramienta con aplicaciones reales. A medida que estos modelos sigan evolucionando, es probable que veamos una adopción aún mayor en entornos profesionales, así como nuevos debates sobre los límites éticos y creativos de la inteligencia artificial.

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.