Google ha presentado Gemma 4, su familia de modelos abiertos más inteligente hasta la fecha, diseñada específicamente para el razonamiento avanzado y flujos de trabajo agenticos. Desarrollados a partir de la investigación y tecnología de Gemini 3, estos modelos buscan maximizar la inteligencia por parámetro, posicionándose como los modelos abiertos más capaces byte por byte.
Versatilidad en tamaños y despliegue
La familia Gemma 4 se lanza en cuatro configuraciones distintas para adaptarse a diversas necesidades de hardware y despliegue:
- E2B (Effective 2B) y E4B (Effective 4B): Optimizados para ofrecer máxima eficiencia de cómputo y memoria, ideales para dispositivos móviles e IoT.
- 26B (Mixture of Experts – MoE) y 31B (Dense): Diseñados para proporcionar inteligencia de frontera en computadoras personales, permitiendo que Gemma 4 ejecute IA de vanguardia en una sola GPU.
Capacidades avanzadas y razonamiento multimodal
Más allá de las funciones de chat convencionales, Gemma 4 introduce capacidades diseñadas para llevar habilidades agenticas de última generación al borde (edge). Entre sus funciones principales destacan:
- Flujos de trabajo agenticos: Soporte nativo para llamadas de funciones (*function calling*), permitiendo la creación de agentes autónomos que pueden planificar, navegar por aplicaciones y completar tareas.
- Razonamiento multimodal: Capacidad de comprensión visual y auditiva avanzada.
- Soporte lingüístico: Compatibilidad con 140 idiomas, enfocándose en el contexto cultural más allá de la traducción simple.
- Optimización: Arquitectura eficiente que permite el despliegue en hardware propio y la posibilidad de realizar un ajuste fino (*fine-tuning*) mediante diversos marcos de trabajo.
Rendimiento y posicionamiento en la industria
En términos de desempeño, el modelo de 31B se sitúa actualmente como el tercer modelo abierto a nivel mundial en el leaderboard de texto de Arena AI, mientras que la versión de 26B ocupa la sexta posición. Google destaca que Gemma 4 es capaz de superar a modelos que tienen hasta 20 veces su tamaño.
Esta nueva generación de modelos, que forma parte de los anuncios de IA más importantes de Google esta semana, está disponible bajo una licencia Apache 2.0, complementando la oferta de modelos propietarios de Gemini para brindar a los desarrolladores un ecosistema híbrido de herramientas potentes.
