Un grupo de activistas ha afirmado haber extraído millones de canciones de Spotify y se prepara para publicarlas en línea.
Observadores del sector sugieren que esta filtración podría beneficiar a las empresas de inteligencia artificial (IA) que buscan material para desarrollar sus tecnologías.
El grupo, autodenominado Anna’s Archive, asegura haber recopilado 86 millones de archivos de música y 256 millones de metadatos, como nombres de artistas y álbumes. Spotify, que alberga más de 100 millones de canciones, ha confirmado que la filtración no representa la totalidad de su inventario.
La compañía, con sede en Estocolmo y más de 700 millones de usuarios en todo el mundo, ha declarado haber “identificado y desactivado las cuentas de usuario maliciosas que participaron en la extracción ilegal de datos”.
“Una investigación sobre el acceso no autorizado reveló que un tercero extrajo metadatos públicos y utilizó tácticas ilícitas para eludir la gestión de derechos digitales (DRM) y acceder a algunos de los archivos de audio de la plataforma. Estamos investigando activamente el incidente”, comunicó Spotify.
Spotify no cree que la música extraída por Anna’s Archive haya sido publicada aún. El grupo, conocido por proporcionar enlaces a libros pirateados, ha declarado en su blog que su objetivo es crear un “archivo de preservación” para la música.
Anna’s Archive afirma que los archivos de audio representan el 99,6% de toda la música escuchada por los usuarios de Spotify y que se compartirán a través de “torrents”, un método para compartir archivos digitales grandes en línea.
“Por supuesto, Spotify no tiene toda la música del mundo, pero es un buen comienzo”, señaló Anna’s Archive, describiendo su misión como “preservar el conocimiento y la cultura de la humanidad”.
“Con su ayuda, el patrimonio musical de la humanidad estará protegido para siempre de la destrucción por desastres naturales, guerras, recortes presupuestarios y otros desastres”, añadió el grupo.
Ed Newton-Rex, compositor y activista en la defensa de los derechos de autor de los artistas, considera que la música filtrada probablemente se utilizará para desarrollar modelos de IA.
“Entrenar con material pirateado es lamentablemente común en la industria de la IA, por lo que es casi seguro que esta música robada termine entrenando modelos de IA. Por eso, los gobiernos deben insistir en que las empresas de IA revelen los datos de entrenamiento que utilizan”, afirmó.
El sitio web de Anna’s Archive hace referencia a LibGen, un vasto archivo en línea de libros pirateados que, según se alega, ha sido utilizado por Meta, la empresa de Mark Zuckerberg, para entrenar sus modelos de IA. Según un documento judicial presentado en Estados Unidos, Zuckerberg, fundador y director ejecutivo de Meta, aprobó el uso del conjunto de datos de LibGen a pesar de las advertencias dentro del equipo ejecutivo de IA de la empresa de que se trataba de un conjunto de datos “que sabemos que es pirateado”.
Meta defendió con éxito una demanda por infracción de derechos de autor presentada por autores, pero los demandantes en el caso buscan modificar su reclamación.
El cofundador de una startup de IA escribió en LinkedIn que, en teoría, el público podría “crear su propia versión gratuita y personal de Spotify”. Yoav Zimmerman, cofundador de Third Chair, también señaló que esto podría permitir a las empresas tecnológicas “entrenar con música moderna a gran escala”.
Añadió: “Lo único que les impide hacerlo es la ley de derechos de autor y la disuasión de su aplicación”.
La ley de derechos de autor se ha convertido en un campo de batalla entre artistas, autores y creadores, por un lado, y las empresas de IA, por el otro. Las herramientas de IA, como los chatbots y los generadores de música, se entrenan con grandes cantidades de datos extraídos de la web abierta, incluido el material protegido por derechos de autor.
En el Reino Unido, los profesionales creativos han protestado contra una propuesta gubernamental que permitiría a las empresas de IA utilizar obras protegidas por derechos de autor sin permiso, a menos que el titular de los derechos de autor indique que no desea que se utilicen sus datos. Casi todos los participantes en una consulta gubernamental sobre la propuesta han apoyado las preocupaciones de los artistas.
Liz Kendall, la secretaria de Estado para Ciencia, Innovación y Tecnología, declaró ante el Parlamento este mes que no existe “un consenso claro” sobre el tema, añadiendo que los ministros “se tomarán el tiempo necesario para hacerlo bien”. El gobierno se ha comprometido a presentar propuestas de política sobre IA y derechos de autor antes del 18 de marzo del próximo año.
