Hace poco, decidí poner a prueba a tres de los modelos de lenguaje más grandes disponibles actualmente: Claude, ChatGPT y Gemini. El desafío fue sencillo pero revelador: pedirles que construyeran desde cero la misma extensión de Chrome, sin guía adicional más allá de la idea inicial.
El objetivo era evaluar qué tan bien cada modelo podía tomar un concepto simple y desarrollar el resto por cuenta propia, simulando lo que muchos ahora llaman «vibe coding». Para mantener la prueba justa, utilicé la misma solicitud para los tres, evitando herramientas especializadas como Claude Code, Codex o el entorno Antigravity de Google que trabaja con Gemini.
Según relata Mahnoor Faisal, periodista de tecnología con experiencia en medios como XDA, SlashGear, MakeUseOf y Laptop Mag, quien actualmente cursa una carrera en ciencias de la computación, el primer intento que tuvo con este tipo de programación no fue un sitio web o una aplicación, sino una extensión de Chrome. Aunque no recuerda exactamente qué debía hacer esa primera versión, sí confirma que funcionó.
Esta experiencia la motivó a replicar el experimento con los modelos de IA más destacados, buscando entender sus capacidades reales en un entorno de desarrollo práctico y limitado, como lo es la creación de una extensión para navegador.
