IA reproduce Harry Potter: Riesgo de filtración de derechos de autor

by Editor de Tecnologia

Un reciente estudio realizado por investigadores independientes de seguridad e inteligencia artificial ha revelado que algunos chatbots comerciales de IA son capaces de reproducir libros completos, como la saga de Harry Potter, cuando se les proporciona una instrucción específica. Este hallazgo reaviva las preocupaciones sobre la posible filtración de contenido protegido por derechos de autor a través de la inteligencia artificial generativa.

La investigación destaca que los grandes modelos de lenguaje (LLM) modernos se entrenan utilizando vastos conjuntos de datos que podrían contener material multimedia no autorizado. Bajo ciertas condiciones, estos modelos pueden ser inducidos a recrear libros, informes de noticias y guiones, lo que plantea importantes cuestiones legales y éticas.

El experimento, llevado a cabo por investigadores de las universidades de Stanford y Yale, evaluó varios modelos comerciales. Se descubrió que Claude 3.7 Sonnet, GPT-4.1, Gemini 2.5 Pro y Grok 3 demostraron la capacidad de memorizar y reproducir contenido protegido por derechos de autor, comportándose de manera similar a los modelos de código abierto. Los investigadores señalan que este resultado no es trivial, dado que la mayoría de los modelos comerciales implementan mecanismos de seguridad y tienen una transparencia limitada en cuanto a sus fuentes de datos de entrenamiento.

El estudio profundiza en que, con indicaciones específicas, los modelos pueden generar grandes cantidades de texto protegido por derechos de autor. Por ejemplo, los investigadores lograron extraer casi el 95.8% del contenido de Harry Potter y la piedra filosofal de una versión “jailbreak” de Claude 3.7 Sonnet. Gemini 2.5 Pro y Grok 3, incluso sin ser sometidos a un “jailbreak”, pudieron reproducir el 76.8% y el 70.3% del texto, respectivamente. En contraste, GPT-4.1 de OpenAI mostró mayor resistencia, reproduciendo solo alrededor del 4% del contenido.

leer más  Irán: Más de 300 horas de apagón de internet y control de la información

Si los servicios de IA comercial pueden generar extensos fragmentos de obras literarias a petición, los titulares de derechos podrían argumentar que estos servicios constituyen esencialmente canales de distribución no autorizados, en lugar de simples herramientas de “transformación”. Esto intensificaría el debate sobre la legalidad de incluir libros protegidos por derechos de autor en los datos de entrenamiento de la IA.

Legisladores en Estados Unidos y la Unión Europea están elaborando marcos regulatorios relacionados con el entrenamiento de la IA y los derechos de propiedad intelectual. Expertos de la industria advierten que el uso inadecuado de bibliotecas de contenido multimedia para el entrenamiento de la IA podría generar riesgos sistémicos de infracción. Para mitigar estas controversias, los proveedores de modelos están implementando más filtros y estrategias de rechazo para reducir la probabilidad de que los modelos memoricen contenido. Sin embargo, los investigadores de seguridad también señalan que las indicaciones adversas específicas a menudo pueden eludir estas medidas de protección.

(首圖來源:Harry Potter

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.