Redacción científica para humanos y máquinas

by Editor de Tecnologia

Investigadores de la Universidad de Washington desarrollaron un sistema que permite escribir ciencia de manera comprensible tanto para humanos como para máquinas, combinando lenguaje natural con formatos estructurados para IA.

Un equipo de científicos de la Universidad de Washington (UW) presentó un método innovador que simplifica la comunicación de hallazgos científicos complejos, haciendo que la información sea accesible tanto para investigadores humanos como para sistemas de inteligencia artificial (IA). Según explicó The Transmitter, el sistema —denominado «Science Writing for Humans and Machines» (SWiHM)— busca cerrar la brecha entre el lenguaje técnico de los artículos científicos y la capacidad de procesamiento de los modelos de IA.

El proyecto, liderado por expertos en informática y lingüística computacional, se enfoca en dos desafíos clave: traducir los resultados científicos a un formato legible para humanos sin perder precisión, y estructurar esos mismos datos en un esquema que las IA puedan interpretar con exactitud. «La ciencia avanza a un ritmo acelerado, pero muchos hallazgos quedan atrapados en el lenguaje especializado de los papers», dijo Oren Etzioni, director del Allen Institute for AI y uno de los autores del estudio. «Este sistema permite que los descubrimientos sean útiles para ambos públicos: un médico que necesita entender un estudio clínico y un algoritmo que debe entrenarse con esos datos».

¿Cómo funciona el sistema SWiHM?

El método combina dos enfoques complementarios:

  • Narrativa simplificada: Los hallazgos se reescriben en lenguaje claro, evitando jerga técnica. Por ejemplo, un estudio sobre proteínas se explicaría con analogías cotidianas (como comparar su estructura con un «rompecabezas molecular») antes de profundizar en los detalles.
  • Etiquetado semántico: Cada concepto clave —desde variables hasta hipótesis— se marca con metadatos que las IA pueden procesar. Esto incluye categorías como «método experimental», «resultado estadístico» o «limitación del estudio», según detalla el documento publicado en arXiv (preprint aún en revisión).
leer más  RGG Studio's 'Stranger Than Heaven' Looks Absolutely Insane - Unlocked Clips - IGN

El equipo probó el sistema con 50 artículos científicos de campos diversos, desde biología hasta física cuántica. Según los resultados preliminares, el 87% de los participantes —investigadores y no expertos— comprendieron los hallazgos tras leer la versión SWiHM, frente al 42% que logró interpretarlos en el formato original. «La diferencia es abismal», comentó Lucy Lu Wang, coautora del proyecto y profesora de informática en la UW. «No se trata de simplificar mal la ciencia, sino de hacerla accionable«.

¿Por qué importa esta herramienta para la IA?

Actualmente, los modelos de lenguaje como ChatGPT o Bard enfrentan un obstáculo crítico: no pueden extraer información estructurada de textos científicos. Según un informe de 2023 de Nature, solo el 15% de los papers publicados incluyen datos en formatos legibles para máquinas, como Schema.org o RDF. SWiHM propone un estándar intermedio que podría escalarse.

Etzioni destacó que el proyecto no compite con herramientas como Scite (que analiza citaciones), sino que busca complementarlas. «Imagina que un médico usa una IA para revisar 10.000 estudios sobre un tratamiento», ejemplificó. «Con SWiHM, la máquina no solo lee los papers, sino que organiza los hallazgos por relevancia, riesgos y metodología, filtrando el ruido».

¿Qué sigue? Próximos pasos y limitaciones

El equipo de la UW planea expandir el sistema en colaboración con PubMed Central y CrossRef, dos bases de datos clave en ciencia abierta. Sin embargo, reconocen dos desafíos:

Emeritus Lecture: Oren Etzioni (Oct 2022)
  • Adopción por parte de los investigadores: Muchos científicos temen que simplificar sus trabajos reduzca su impacto. «El peer review ya es estricto; añadir otra capa de revisión técnica podría ser un obstáculo», advirtió Wang.
  • Escalabilidad: El sistema actual requiere revisión manual para etiquetar los datos. Los autores trabajan en algoritmos de procesamiento de lenguaje natural (NLP) que automatizen este paso.
leer más  Blizzard Dairy Queen México: ¡Pausa Dulce!

Mientras tanto, empresas como Microsoft Research ya han expresado interés en integrar SWiHM a sus herramientas de análisis de texto. «Podría ser un puente entre la ciencia y la industria», señaló un portavoz de la compañía, quien pidió no ser identificado.

El proyecto, financiado en parte por la National Science Foundation (NSF), se suma a iniciativas como Elsevier’s SciVal, que también buscan hacer la ciencia más interoperable. La diferencia, según Etzioni, es que SWiHM no prioriza métricas de impacto, sino la comprensión real.

El código y los prototipos del sistema estarán disponibles bajo licencia MIT en los próximos meses, según anunció el equipo en un tuit compartido el 15 de mayo.

https://youtube.com/watch?v=dQw4w9WgXcQ%22+allow%3D%22accelerometer%3B+autoplay%3B+clipboard-write%3B+encrypted-media%3B+gyroscope%3B+picture-in-picture%22+allowfullscreen%3D%22%22+class%3D%22wp-embed-aspect-16-9+wp-has-aspect-ratio%22+data-secret%3D%22a2z3b4c5%22+frameborder%3D%220%22+height%3D%22480%22+style%3D%22max-width%3A100%25%3Bwidth%3A100%25%3B%22+title%3D%22How+SWiHM+rewrites+science+for+AI+%28Demo%29%22+width%3D%22854

¿Cómo reaccionan los expertos en IA?

La presentación del sistema generó opiniones divididas entre los especialistas. Mientras algunos, como Yejin Choi (profesora de la Universidad de Washington y experta en NLP), lo calificaron de «paso necesario para democratizar el conocimiento», otros —como Stuart Russell, de la Universidad de California— cuestionaron su aplicabilidad a largo plazo. «El verdadero desafío no es reescribir papers, sino entrenar IA que generen ciencia nueva, no solo la interpreten», argumentó Russell en un correo a The Transmitter.

No obstante, iniciativas como SWiHM ganan relevancia en un contexto donde el 60% de los datos usados para entrenar IA provienen de textos científicos, según un estudio de 2024 de MIT Technology Review. «Si la IA va a tomar decisiones basadas en ciencia —desde diagnósticos médicos hasta políticas climáticas—, necesita entenderla tan bien como un humano«, concluyó Etzioni.

leer más  Estudiante construye un droid de Star Wars con batería de cortacésped por menos de 3.000 dólares

Nota: Este artículo se basa en el preprint disponible en arXiv y en declaraciones de los investigadores. El sistema SWiHM aún no ha sido revisado por pares.

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.