Spotify: Fuga masiva de datos musicales (256M canciones)

by Editor de Tecnologia

Spotify no ha recibido el regalo navideño que esperaba: una gran cantidad de sus metadatos ha sido publicada en redes de intercambio de archivos.

Según informó Billboard, un “grupo activista pirata” accedió a 256 millones de filas de metadatos de canciones y 86 millones de archivos de audio, aunque hasta el momento solo los metadatos han sido liberados a través de Anna’s Archive, un motor de búsqueda para “bibliotecas en la sombra” que anteriormente se ha centrado más en libros.

“Hicimos una copia de seguridad de Spotify (metadatos y archivos de música). Se distribuye en torrents masivos (~300TB), agrupados por popularidad”, afirmó una publicación en el blog del sitio. “Esta publicación incluye la base de datos de metadatos musicales más grande disponible públicamente con 256 millones de pistas y 186 millones de ISRC únicos.”

“Es el primer ‘archivo de preservación’ del mundo para la música que es totalmente abierto (lo que significa que puede ser fácilmente reflejado por cualquiera con suficiente espacio en disco), con 86 millones de archivos de música, que representan alrededor del 99.6% de las reproducciones.”

En teoría, cualquiera podría usar este archivo para construir su propio clon de Spotify. En la práctica, la respuesta de los titulares de derechos a cualquier esfuerzo de este tipo sería rápida y significativa. Recordemos que demandaron (y llegaron a un acuerdo con) The Internet Archive, y eso fue por un archivo de preservación que consistía únicamente en viejos discos de 78 rpm.

“Una investigación sobre el acceso no autorizado identificó que un tercero extrajo metadatos públicos y utilizó tácticas ilícitas para eludir la DRM para acceder a algunos de los archivos de audio de la plataforma. Estamos investigando activamente el incidente”, declaró un portavoz de Spotify a Music Ally.

leer más  WiiM Sound Lite: Nuevo Altavoz Inalámbrico con Room Correction

También describieron a los activistas como “extremistas anti-copyright que previamente han pirateado contenido de YouTube y otras plataformas”.

La investigación de Spotify continúa, incluyendo qué fue exactamente lo que accedieron los activistas y cómo. Cabe destacar que esto no es una fuga o una brecha de seguridad con implicaciones para los usuarios. Actualmente se cree que los activistas utilizaron la API web pública de Spotify para extraer los metadatos.

La comparación con YouTube realizada por Spotify es importante. Los conjuntos de datos de ese servicio también han estado circulando durante algún tiempo y se cree que son una de las fuentes que los servicios de música GenAI no autorizados han utilizado para entrenar sus modelos.

Por lo tanto, lo más preocupante para la industria musical podría ser no tanto que la gente construya sus propios clones gratuitos de Spotify, sino más bien el potencial de que el conjunto de datos y el audio socaven los esfuerzos de concesión de licencias con las empresas de IA, incluso si las que lo desean ya podrían obtener este tipo de contenido musical de otras maneras.

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.