Auriculares IA: Aislamiento de Voz y Ruido de Fondo

En entornos ruidosos, donde conversaciones, música y otros sonidos dificultan la comunicación, un reciente avance tecnológico promete revolucionar la experiencia auditiva. Investigadores de la Universidad de Washington han desarrollado un prototipo de auriculares que, gracias a la inteligencia artificial, pueden aislar automáticamente las voces de las personas con las que interactúa el usuario y suprimir el ruido de fondo y otras conversaciones.

Este desarrollo representa un importante paso adelante para personas con problemas de audición y para cualquier usuario que busque mayor claridad en ambientes sonoros complejos, ofreciendo una solución automática y no invasiva que podría redefinir la tecnología auditiva y la interacción diaria.

A diferencia de tecnologías anteriores que requerían ajustes manuales o incluso procedimientos invasivos, este prototipo funciona de forma autónoma. Los auriculares detectan quiénes participan en la conversación y silencian las voces que no se ajustan al ritmo natural del intercambio de palabras.

El prototipo utiliza inteligencia artificial para identificar los participantes de una conversación y filtrar los sonidos ajenos, sin necesidad de intervención manual.

El sistema emplea dos modelos de inteligencia artificial: uno analiza los patrones temporales del diálogo para identificar a los interlocutores, mientras que el otro filtra los sonidos irrelevantes. En un lapso de dos a cuatro segundos, los auriculares reconocen y aíslan las voces importantes, eliminando la necesidad de que el usuario seleccione manualmente a quién escuchar o ajuste parámetros de distancia.

El funcionamiento técnico se basa en la observación de que, durante una conversación, las personas siguen un ritmo de turnos de palabra que puede predecirse y rastrearse únicamente a partir del audio. El sistema se activa cuando el usuario comienza a hablar; en ese momento, el primer modelo determina quién habló y cuándo, buscando una baja superposición entre los participantes.

leer más UNESCO: Ayuda a Ucrania y Crisis Globales - 2024

Posteriormente, el segundo modelo limpia la señal y devuelve en tiempo real el audio aislado al usuario. Este enfoque contrasta con métodos anteriores que dependían de la selección manual de interlocutores o incluso del uso de electrodos implantados en el cerebro para rastrear la atención.

El sistema detecta quién habla mediante el ritmo de turnos de palabra y selecciona en segundos las voces relevantes, simplificando el proceso para el usuario. (Imagen Ilustrativa Infobae)

En las pruebas realizadas, el prototipo demostró su capacidad para gestionar conversaciones entre el usuario y hasta cuatro personas adicionales sin demoras perceptibles. Once participantes evaluaron la experiencia, calificando la claridad, la supresión de ruido y la comprensión tanto con los filtros activados como desactivados.

Los resultados mostraron que la versión filtrada duplicó la puntuación en comparación con la experiencia sin filtros. Además, el diseño actual elimina la necesidad de enfocar la atención en una persona específica o de ajustar burbujas de audio según la distancia, lo que simplifica su uso en comparación con prototipos anteriores.

Sin embargo, el sistema aún presenta desafíos en situaciones de habla caótica, como cuando varias personas interrumpen, hablan simultáneamente o se unen a la conversación en curso, lo que puede dificultar el seguimiento de los interlocutores. Los modelos han sido entrenados en inglés, mandarín y japonés, por lo que la adaptación a otros idiomas podría requerir ajustes adicionales.

Pruebas con usuarios demostraron que la versión filtrada de los auriculares mejora notablemente la claridad y comprensión del diálogo en espacios ruidosos. (Imagen Ilustrativa Infobae)

El prototipo actual utiliza auriculares comerciales de diadema y circuitos básicos, pero los investigadores prevén que la tecnología podrá miniaturizarse para integrarse en audífonos, auriculares intraurales o incluso gafas inteligentes. En trabajos relacionados, el equipo ha demostrado que modelos similares ya pueden funcionar en chips del tamaño de los empleados en audífonos.

leer más Responde a mensajes de WhatsApp desde tu reloj Garmin (modelos compatibles)

El código subyacente de este avance es de código abierto, lo que facilita su desarrollo y adaptación futura. Esta tecnología anticipa la intención del usuario de manera automática y sin intervenciones invasivas, abriendo nuevas posibilidades para la accesibilidad y la interacción en entornos complejos.

Auriculares IA: Aislamiento de Voz y Ruido de Fondo

Related

A3: Militares franceses salvan a conductor de camión tras accidente

Brad Johnson: Exjugador de Bulldogs revela lucha contra el cáncer

You may also like

Leave a Comment Cancel Reply