ChatGPT Images 2.0 vs. Gemini Nano Banana: ¿Cuál genera imágenes con mayor precisión en pruebas cotidianas?
La carrera por dominar la generación de imágenes con inteligencia artificial sigue acelerándose. En las últimas semanas, OpenAI lanzó ChatGPT Images 2.0, una versión mejorada de su modelo de creación visual, mientras que Google actualizó su competidor, Gemini Nano Banana. Para evaluar cuál de los dos ofrece mejores resultados en situaciones reales, el editor senior de tecnología David Gewirtz, de ZDNET, realizó una serie de pruebas comparativas con nueve prompts cotidianos. Los resultados revelaron diferencias clave en precisión, manejo de texto y adaptabilidad a instrucciones complejas.
From Instagram — related to Gemini Nano Banana, David GewirtzEjemplo de generación de imágenes con texto integrado, donde ChatGPT Images 2.0 demostró mayor precisión en la renderización de caracteres.
Metodología de las pruebas
Gewirtz diseñó un conjunto de pruebas basadas en escenarios comunes para usuarios, que incluyeron:
Generación de imágenes con texto integrado (ej.: carteles, memes o diseños con frases).
Recreación de personajes de cultura pop con descripciones detalladas.
Escenas complejas con múltiples elementos y relaciones espaciales (ej.: «un gato usando gafas de sol en una playa al atardecer»).
Adaptación a estilos artísticos específicos (ej.: «pintura al óleo en estilo impresionista»).
En diciembre de 2025, Gemini Nano Banana había superado a ChatGPT en estas pruebas con un 93% de precisión, frente al 74% de su competidor. Sin embargo, Gewirtz decidió repetir las pruebas con las versiones actualizadas de ambos modelos para evaluar su evolución.
Resultados: ChatGPT Images 2.0 toma la delantera
Los hallazgos más destacados de la comparación fueron:
Images Mientras
1. Renderización de texto
ChatGPT Images 2.0 mostró una mejora significativa en la generación de texto dentro de las imágenes. Mientras que Nano Banana cometía errores frecuentes en la ortografía o el espaciado de caracteres, la versión de OpenAI logró mantener la coherencia incluso en frases largas o con fuentes poco convencionales. Este avance es especialmente relevante para diseñadores o creadores de contenido que necesitan integrar texto en sus composiciones visuales.
ChatGPT Images VS Gemini Nano Banana Pro: Which is BETTER?
Video comparativo de la generación de texto en ambos modelos.
2. Fidelidad a los prompts
Uno de los puntos débiles de Nano Banana fue su tendencia a ignorar o malinterpretar partes clave de las instrucciones. Por ejemplo, al solicitar «un dragón con escamas azules y alas de murciélago en un bosque nevado», el modelo de Google a veces omitía elementos como el colour de las escamas o el entorno. ChatGPT Images 2.0, en cambio, demostró mayor disciplina al seguir las indicaciones al pie de la letra, incluso en prompts con múltiples condiciones.
3. Privacidad y personalización
Un aspecto que generó controversia en las pruebas fue la función de personalización de Gemini Nano Banana. El modelo de Google intentó adaptar las imágenes a preferencias supuestamente inferidas del usuario, como incluir rostros reconocibles o estilos artísticos basados en búsquedas previas. Esto planteó preocupaciones sobre el uso de datos personales sin consentimiento explícito, un problema que no se observó en ChatGPT Images 2.0.
Más allá de la competencia entre gigantes tecnológicos, estas pruebas reflejan un avance crucial en la utilidad práctica de la IA generativa. ChatGPT Images 2.0 no solo mejora en aspectos técnicos como la renderización de texto, sino que también ofrece mayor transparencia en su funcionamiento, un factor clave para usuarios profesionales que dependen de estas herramientas en entornos laborales.
Sin embargo, Gewirtz advierte que ninguno de los dos modelos es perfecto. Ambos aún cometen errores en escenas con perspectivas complejas o en la representación de manos y rostros humanos, un desafío recurrente en la generación de imágenes con IA. Además, la brecha entre lo que prometen los anuncios de las empresas y lo que realmente entregan sigue siendo un tema de debate en la industria.
El contexto: ¿Por qué OpenAI lanzó un nuevo modelo de imágenes?
El lanzamiento de ChatGPT Images 2.0 llega en un momento en que OpenAI ha reorientado sus esfuerzos en generación visual. En febrero de 2026, la compañía canceló el desarrollo de Sora, su ambicioso modelo de generación de video, para enfocarse en mejorar las capacidades de su herramienta de imágenes. Según fuentes citadas por CNET, esta decisión respondió a la necesidad de priorizar aplicaciones con mayor demanda inmediata, como la creación de gráficos para redes sociales, presentaciones o prototipos de diseño.
Images Mientras Esto
La apuesta parece estar dando resultados. Mientras que en 2025 la generación de imágenes con IA era vista como un juguete para creativos, hoy herramientas como ChatGPT Images 2.0 están siendo adoptadas por profesionales en campos como el marketing, la educación y el desarrollo de productos. Esto ha reavivado el debate sobre el impacto de la IA en industrias creativas, con algunos diseñadores gráficos expresando preocupación por la posible automatización de sus trabajos.
La discusión sobre si la IA reemplazará a los diseñadores gráficos sigue abierta.
Conclusión: ¿Cuál elegir?
Los resultados de las pruebas sugieren que ChatGPT Images 2.0 es la opción más confiable para usuarios que buscan precisión y consistencia, especialmente en tareas que involucran texto o instrucciones detalladas. Por otro lado, Gemini Nano Banana podría seguir siendo relevante para quienes priorizan la integración con otros servicios de Google o buscan experimentar con funciones de personalización, aunque con reservas sobre la privacidad.
Lo que está claro es que la generación de imágenes con IA ha dejado de ser una curiosidad tecnológica para convertirse en una herramienta con aplicaciones reales. A medida que estos modelos sigan evolucionando, es probable que veamos una adopción aún mayor en entornos profesionales, así como nuevos debates sobre los límites éticos y creativos de la inteligencia artificial.
Carlos Vega es editor de Tecnología y sigue de cerca la innovación digital, la inteligencia artificial, el hardware, el software y las grandes plataformas tecnológicas. Explica cómo los avances tecnológicos afectan la vida cotidiana y el trabajo.