Apple ha recurrido a Gemini de Google para potenciar la próxima generación de Siri, una alianza inusual entre dos rivales acérrimos que señala la rapidez con la que están cambiando las dinámicas de las plataformas de inteligencia artificial. Las compañías confirmaron la medida a través de publicaciones en X, indicando que Gemini ayudará a impulsar las próximas funciones de Apple Intelligence, incluida la tan esperada renovación de Siri programada para su lanzamiento este año.
¿Por qué Apple eligió a Gemini para acelerar la renovación de Siri?
Gemini aporta las fortalezas que Apple necesita en este momento: un razonamiento multimodal robusto, una gestión de contexto amplio y una sólida orquestación de herramientas. Google ha destacado la capacidad de Gemini 1.5 para procesar documentos extensos y medios mixtos, una capacidad que se alinea con las actualizaciones más solicitadas para Siri: resumir mensajes, comprender el contenido en pantalla y ejecutar tareas complejas en varias aplicaciones.
Las evaluaciones independientes han demostrado cada vez más una competencia estrecha entre los modelos principales. Clasificaciones públicas como LMSYS Chatbot Arena e informes académicos han registrado frecuentes cambios de liderazgo entre Gemini y sistemas de la clase GPT-4 en razonamiento, codificación y seguimiento de instrucciones. En la práctica, la diferencia puede residir en la fiabilidad y el coste a escala, áreas donde Apple, con cientos de millones de invocaciones diarias de Siri, no puede permitirse sorpresas.
Igualmente importante, Apple puede combinar Gemini con sus propios modelos integrados que se ejecutan en Apple Silicon. Este diseño híbrido –inferencia local para tareas privadas y de baja latencia, y llamadas a la nube para trabajos más pesados– coincide con la arquitectura que Apple introdujo con Apple Intelligence. Reduce la dependencia de un único proveedor al tiempo que amplía lo que Siri puede hacer de inmediato.
¿Qué cambios se esperan en Siri con la integración de Gemini en Apple Intelligence?
La “Siri con IA” que Apple ha presentado tiene como objetivo comprender el contexto en diferentes aplicaciones, actuar en nombre de los usuarios y conversar de forma natural. Con Gemini en la mezcla, se esperan respuestas más completas, una mejor comprensión de lo que aparece en la pantalla y acciones más fiables en varios pasos. Por ejemplo: “Encuentra los archivos que mi jefe me envió la semana pasada, redacta una respuesta y programa una revisión de 30 minutos”.
Las amplias ventanas de contexto de Gemini pueden ayudar a Siri a resumir largas cadenas de correo electrónico, notas de reuniones o archivos PDF sin transferencias frágiles. Sus capacidades multimodales deberían mejorar tareas como describir fotos para componer mensajes o extraer detalles de imágenes para rellenar formularios. La capa de orquestación de Apple puede dirigir las solicitudes más sencillas a los modelos integrados y escalar a Gemini cuando la tarea supera los límites locales.
Privacidad y control cuando las solicitudes de Siri utilizan Gemini de Google
Apple afirma que la privacidad sigue siendo la principal prioridad. Con Apple Intelligence, las solicitudes que abandonan el dispositivo utilizan Private Cloud Compute, que se ha descrito como la ejecución en servidores controlados por Apple y la eliminación de datos transitorios después del procesamiento. Cuando Siri depende de un modelo de terceros como Gemini, se solicita el consentimiento de los usuarios para cada solicitud, manteniendo una clara distinción entre el procesamiento local y en la nube.
Este enfoque refleja el diseño de Apple para 2024 en la integración de modelos externos: mantener la personalización rutinaria en el dispositivo, escalar el razonamiento complejo con permiso explícito y utilizar imágenes de servidor verificables para limitar la exposición de datos. La colaboración con Gemini será una prueba importante de esta promesa.
Ganadores, perdedores y cambios en la dinámica del mercado de la IA tras el acuerdo
Para Google, conseguir a Siri es una gran victoria que extiende Gemini más allá de las asociaciones con Android y hacia el corazón del ecosistema de Apple. Para OpenAI, es un revés después de que Apple integrara ChatGPT como una opción en Siri a finales de 2024. La realidad práctica es un futuro multi-modelo: Apple puede dirigir las tareas entre proveedores a medida que evolucionan las capacidades y los costes, evitando que un único modelo se convierta en un valor predeterminado permanente.
Las apuestas son enormes debido a la distribución. Apple informó de un récord de 2.200 millones de dispositivos activos en 2024, y Siri está a un toque o palabra de activación en iPhone, iPad, Mac, Watch y CarPlay. Incluso pequeños cambios en el comportamiento predeterminado de la IA a esa escala pueden remodelar las prioridades de los desarrolladores, las cargas de trabajo de inferencia y la economía del entrenamiento de modelos.
Qué deben tener en cuenta los desarrolladores a medida que se profundizan los vínculos de Siri con App Intents
Se esperan vínculos más estrechos entre Siri y App Intents, lo que permitirá al asistente encadenar acciones en aplicaciones de terceros con menos scripts frágiles. Los desarrolladores deben diseñar intenciones y metadatos para el descubrimiento de la IA, proporcionar indicaciones claras para acciones reversibles y preparar el contenido para el resumen y la extracción. Si Apple expone un enrutamiento de modelos más granular, las aplicaciones también pueden obtener pistas sobre cuándo una solicitud está en el dispositivo frente a cuando se escala, lo que informa las decisiones de la experiencia del usuario en torno a la latencia y las indicaciones del usuario.
El camino por delante para Apple, Google y una Siri multi-modelo
Dos preguntas clave se ciernen sobre el futuro. Primero, ¿pueden Apple y Google ofrecer un razonamiento de nivel de nube con la velocidad y la privacidad que los usuarios esperan de los asistentes integrados en los dispositivos? Segundo, ¿cómo verán los reguladores vínculos de infraestructura más profundos entre el duopolio móvil, dada la continua supervisión de los servicios predeterminados y el poder de la plataforma?
Si el lanzamiento cumple su promesa, Siri podría finalmente pasar de ser un control remoto de voz a un verdadero asistente de IA: consciente del contexto, capaz de actuar y de confianza. El acuerdo con Gemini le da a Apple una vía más rápida hacia ese destino, al tiempo que mantiene la puerta abierta a un futuro competitivo y agnóstico a los modelos.
