The Information ha publicado un informe con detalles interesantes sobre la asociación entre Apple y Google, que tendrá a Gemini como base para sus funciones de inteligencia artificial, incluyendo la nueva Siri. A continuación, los detalles.
Ajuste interno, sin marca Google o Gemini
El anuncio conjunto de ayer sobre la decisión de Apple de depender de Gemini para impulsar sus funciones de IA fue escaso en especificaciones técnicas.
Las compañías declararon que las funciones de Apple basadas en Gemini “continuarán ejecutándose en dispositivos Apple y en Private Cloud Compute”, lo que significa que Google no tendrá acceso a los datos del usuario por diseño, pero eso fue todo.
Hoy, The Information publicó una mirada interesante a algunos aspectos de la asociación, incluyendo el hecho de que Apple podrá ajustar su versión del modelo Gemini de forma independiente:
Apple puede pedir a Google que modifique aspectos del funcionamiento del modelo Gemini, pero en caso contrario, Apple puede ajustar Gemini por sí mismo para que responda a las consultas de la manera que Apple prefiera, según la persona involucrada en el proyecto.
El informe también responde parcialmente a una pregunta que muchas personas se han estado haciendo o especulando sobre cómo será la prominencia de la marca Google a lo largo de la experiencia:
En el prototipo actual del sistema basado en Gemini de Apple, las respuestas de la IA no incluyen ninguna marca relacionada con Google o Gemini, según esta persona.
Aunque la experiencia final puede cambiar con respecto a la implementación actual, esto se hace eco en parte de un informe de Bloomberg de finales del año pasado, en el que Mark Gurman dijo:
No espero que ninguna de las dos compañías discuta públicamente esta asociación, y no deberías esperar que esto signifique que Siri se verá inundada de servicios de Google o funciones de Gemini que ya se encuentran en los dispositivos Android. Simplemente significa que Siri estará impulsada por un modelo que realmente pueda proporcionar las funciones de IA que los usuarios esperan, todo con una interfaz de usuario de Apple.
The Information también señala que Apple espera que Siri impulsada por Gemini mejore su rendimiento en las respuestas relacionadas con el conocimiento mundial al responder realmente a la pregunta (“como describir la población de un país o información científica”) en lugar de enumerar enlaces para que el usuario los visite.
Siri impulsada por Gemini mejorará en el apoyo emocional
El informe de The Information también señala que Apple espera que Siri impulsada por Gemini se vuelva mejor en brindar apoyo emocional:
“Otro conjunto común de preguntas con las que Siri históricamente ha tenido dificultades involucró el apoyo emocional, como cuando un cliente le dice al asistente de voz que se siente solo o desanimado. En la versión basada en Gemini, Siri dará respuestas conversacionales más completas de la manera en que lo hacen ChatGPT y Gemini, según esta persona.”
Establecer el apoyo emocional como un objetivo podría ser una medida arriesgada, ya que no faltan casos documentados en los que usuarios vulnerables se han autolesionado después de tener conversaciones con chatbots.
En muchas ocasiones, en lugar de ofrecer orientación de seguridad adecuada o dirigir a los usuarios hacia ayuda en el mundo real, los sistemas alucinaron, malinterpretaron la situación o no comprendieron las implicaciones de la conversación, a veces con consecuencias graves.
Cómo manejará exactamente Siri impulsada por Gemini esta situación cuando inevitablemente surja, está por verse.
Sobre esos dos sistemas diferentes
El pasado agosto, en una reunión en toda la empresa, el jefe de software de Apple, Craig Federighi, abordó uno de los mayores problemas de la fallida renovación de Siri de Apple.
En ese momento, Bloomberg informó:
Federighi explicó que el problema fue causado por intentar lanzar una versión de Siri que fusionara dos sistemas diferentes: uno para manejar comandos actuales, como configurar temporizadores, y otro basado en modelos de lenguaje grandes, el software detrás de la IA generativa. “Inicialmente queríamos hacer una arquitectura híbrida, pero nos dimos cuenta de que ese enfoque no nos llevaría a la calidad de Apple”, dijo Federighi.
Si bien el informe de The Information no profundiza exactamente en este aspecto técnico, sí señala lo siguiente:
Si bien ciertas tareas comunes de Siri, como configurar un temporizador, un recordatorio o enviar un mensaje de texto específico a un contacto telefónico, continuarán siendo impulsadas por la tecnología almacenada en los dispositivos Apple, la nueva versión de Siri también podrá manejar instancias en las que la pregunta del cliente no se comprenda claramente.
Por ejemplo, si alguien le pide a Siri que envíe un mensaje de texto a su madre o hermana, pero el cliente no guarda sus nombres de esa manera en sus contactos, Siri basada en Gemini podría buscar en sus mensajes para averiguar cuál de sus contactos es más probable que sea su madre o hermana, según esta persona.
En otras palabras, parece que Apple todavía está buscando fusionar tareas de procesamiento del lenguaje natural tradicionales y de bajo riesgo (como configurar temporizadores o crear recordatorios simples) con tareas más complejas y no deterministas en una sola experiencia optimizada. Como debería ser, desde el punto de vista de la experiencia del usuario.
El problema es que, si bien esto puede parecer trivial a primera vista, ha demostrado ser un esfuerzo desafiante, incluso para Google y para Amazon. Por lo tanto, será interesante aprender más sobre esto a medida que nos acerquemos al lanzamiento real de las primeras funciones de la asociación.
Cronograma
Finalmente, el informe también reafirma que el lanzamiento de las funciones de IA impulsadas por Gemini de Apple será gradual:
Algunas de las funciones se lanzarán esta primavera. Otras, incluida la capacidad de Siri para recordar conversaciones pasadas que ha tenido con un cliente, o funciones proactivas que podrían sugerirles que salgan de casa para evitar el tráfico antes de una recogida en el aeropuerto que figura en su calendario de Apple, se espera que se anuncien en la conferencia anual de desarrolladores de la compañía en junio, según esta persona.
Puedes leer el informe completo de The Information aquí.



