Una investigación reciente publicada por The Guardian reveló la exposición en línea de datos de salud confidenciales del proyecto UK Biobank en múltiples ocasiones. El UK Biobank, una importante iniciativa de investigación médica, alberga los registros de salud de 500,000 voluntarios británicos y se considera uno de los mayores repositorios de datos de salud del mundo.
Este proyecto ha contribuido significativamente a la investigación sobre el cáncer, la demencia y la diabetes. Sin embargo, han surgido preocupaciones sobre la seguridad con la que se protegen los registros de los pacientes dentro de este proyecto.
Fugas de datos causadas por investigadores con acceso a información confidencial
Las fugas de datos parecen haber sido causadas por investigadores que tuvieron acceso a información confidencial del Biobank. Estos archivos, aunque no contienen nombres ni direcciones, aún representan una amenaza para la privacidad. Uno de los conjuntos de datos descubiertos por The Guardian contenía millones de diagnósticos hospitalarios y sus fechas correspondientes de más de 400,000 participantes, lo que plantea serias interrogantes sobre las medidas de seguridad implementadas para proteger estos datos sensibles.
UK Biobank afirma no haber compartido información identificativa con los investigadores
En respuesta a las preocupaciones sobre la exposición de datos, UK Biobank ha mantenido que no se compartió información identificativa con los investigadores. El profesor Sir Rory Collins, director ejecutivo de UK Biobank, afirmó que no hay evidencia de que ningún participante haya sido reidentificado por otros. Esta declaración busca tranquilizar en medio de la creciente preocupación por la seguridad de los datos de salud personales en proyectos de investigación como este.
¿Qué es UK Biobank?
Establecido en 2003, UK Biobank es un vasto repositorio de secuencias genómicas, escaneos, muestras de sangre y datos de estilo de vida de 500,000 voluntarios. El mes pasado, el gobierno amplió el acceso del Biobank a los registros de los médicos de cabecera de los voluntarios. Científicos de universidades y empresas privadas de todo el mundo pueden solicitar acceso a estos datos. Sin embargo, hasta finales de 2024, se les permitía descargarlos directamente en sus propios sistemas informáticos.
Investigadores subieron accidentalmente datos confidenciales a GitHub
El problema de las fugas de datos se debe a que las revistas y los financiadores exigen cada vez más a los investigadores que publiquen su código para analizar grandes conjuntos de datos. En el proceso, algunos investigadores han subido involuntariamente partes o conjuntos de datos completos del Biobank a GitHub, una popular plataforma en línea para compartir código. UK Biobank prohíbe esta práctica y afirma haber implementado capacitación adicional para todos los investigadores con el fin de prevenir incidentes similares.
GitHub cumplió con las solicitudes de eliminar los datos filtrados
Entre julio y diciembre de 2025, UK Biobank emitió 80 notificaciones legales a GitHub por estas fugas de datos. La plataforma ha cumplido con las solicitudes de eliminar los datos filtrados de Internet, aunque una gran parte de ellos aún permanece accesible en línea. Esto destaca la lucha continua que enfrenta UK Biobank para abordar este problema y proteger sus datos de salud confidenciales de una mayor exposición.
Experto sorprendido por el nivel de detalle del conjunto de datos
Un experto en datos que revisó el conjunto de datos en línea que contiene diagnósticos hospitalarios y fechas asociadas de aproximadamente 413,000 participantes, se sorprendió por su nivel de detalle. Afirmó que incluso echar un vistazo constituía una grave invasión de la privacidad.
Prueba realizada por The Guardian con voluntarios
Para evaluar el riesgo de reidentificación, The Guardian se puso en contacto con varios voluntarios del Biobank. Un voluntario que proporcionó fechas de tratamiento por una fractura y una convulsión no pudo ser localizado en el conjunto de datos. Sin embargo, otra voluntaria compartió su mes y año de nacimiento, así como el mes y año en que se sometió a una histerectomía. Solo una persona en el conjunto de datos coincidía con estos detalles, corroborados por cinco diagnósticos adicionales de registros que no se revelaron inicialmente.
