Google ha lanzado una nueva versión de Gemini Deep Research, un agente diseñado para automatizar tareas de investigación complejas.
Este agente, que funciona con el modelo Gemini 3 Pro, es capaz de procesar escritura a mano, gráficos y notación matemática, incorporando esta información visual directamente en sus informes y consultas de búsqueda. Según informa SiliconANGLE, esto permite al sistema no solo buscar en fuentes textuales, sino también recuperar datos que antes eran difíciles de automatizar.
Deep Research opera de forma iterativa y planifica sus pasos de investigación de manera independiente. Formula consultas de búsqueda, evalúa los resultados obtenidos y determina qué información falta. Google afirma que la navegación web en esta nueva versión es más eficiente para acceder a sitios web complejos. Además, los usuarios pueden cargar documentos que se escanean automáticamente en busca de pasajes relevantes, los cuales el agente puede resumir, interpretar o combinar con información de fuentes públicas.
La nueva versión se ofrece a través de la Interactions API, que actúa como un punto de acceso central tanto para los modelos Gemini como para los agentes preconstruidos. Google tiene planes de agregar agentes adicionales y ofrecer soporte para agentes personalizados en el futuro. Esta API también simplifica la gestión de datos para los desarrolladores, reduciendo el tiempo dedicado al procesamiento y la estructuración de archivos, y permite vincular los modelos a sistemas externos a través de MCP.
Las pruebas realizadas por Google indican que el agente ha mejorado su rendimiento en comparación con versiones anteriores. En Humanity’s Last Exam, un conjunto de pruebas con más de 2.500 preguntas centradas en matemáticas, física y programación, el agente obtuvo una puntuación del 46,4%.
Asimismo, el sistema superó a sus predecesores en DeepSearchQA, un conjunto de datos creado por Google que consiste en tareas de información de múltiples pasos, dependientes de análisis previos, y diseñado para medir tanto la precisión como la exhaustividad. Google también utiliza este conjunto de datos internamente para investigar cómo los pasos de razonamiento adicionales y los tiempos de procesamiento más largos afectan al rendimiento.
De acuerdo con SiliconANGLE, Google posiciona Deep Research principalmente como una herramienta para sectores que implican un análisis exhaustivo de documentos y la recopilación de fuentes. En este contexto, el agente está destinado a asumir tareas repetitivas y que consumen mucho tiempo, mientras que la Interactions API simplifica su integración en aplicaciones. Con esta nueva versión, Google busca demostrar cómo los modelos de lenguaje son cada vez más capaces de manejar tareas de investigación que van más allá de la búsqueda o el resumen tradicionales.
