SerpApi desafía demanda de Google por scraping web

by Editor de Tecnologia

SerpApi, una empresa de extracción de datos web con sede en Texas, ha solicitado a un tribunal de California que desestime la demanda de Google, que alega que la compañía sorteó los mecanismos de protección digital para recopilar contenido con derechos de autor de los resultados de búsqueda de Google.

«Google es el mayor extractor de datos del mundo», afirmó la empresa en una publicación de blog el viernes. «Todo el negocio de Google comenzó con un rastreador web que visitó cada página accesible públicamente en Internet, copió el contenido, lo indexó y se lo presentó a los usuarios. Lo hizo sin distinguir entre material con derechos de autor y material sin derechos de autor, y sin pedir permiso. Ahora Google está en un tribunal federal alegando que nuestra extracción de datos es ilegal.»

Google demandó a SerpApi en diciembre de 2025 [PDF], alegando que su extracción de datos elude las medidas de seguridad que Google implementó para proteger el material con derechos de autor que aparece en los resultados de búsqueda. Esto ocurrió dos meses después de que Reddit presentara una demanda similar contra Oxylabs UAB, AWM Proxy y SerpApi, alegando que los demandados habían violado sus propios controles y las defensas de Google.

Google alegó violaciones de la Ley de Derechos de Autor del Milenio Digital (DMCA) de EE. UU., específicamente la elusión de medidas tecnológicas (17 U.S.C. § 1201(a)(1)(A)) y el tráfico de tecnología diseñada para la elusión de medidas tecnológicas (17 U.S.C. § 1201(a)(2)).

«SerpApi toma de forma engañosa contenido que Google licencia a terceros (como imágenes que aparecen en los Paneles de conocimiento, datos en tiempo real en las funciones de búsqueda y mucho más), y luego lo revende por una tarifa», declaró Halimah DeLaine Prado, consejera general de Google, cuando se anunció la demanda. «Al hacerlo, ignora deliberadamente los derechos y las directrices de los sitios web y proveedores cuyo contenido aparece en la Búsqueda.»

leer más  Strands NYT: Solución y pistas de hoy

Ante la solicitud de comentarios, un portavoz de Google remitió a la publicación de Prado.

La cuestión es si el mecanismo que emplea Google para evitar la extracción de datos se califica como una medida de protección tecnológica según la ley, y si el sistema de rastreo de SerpApi elude ilegalmente esa protección.

Se trata de una cuestión que ha cobrado gran importancia a la luz de los crecientes esfuerzos por recopilar datos de sitios web y aplicar contramedidas, tanto técnicas como legales.

Google, en su denuncia, se refiere a su tecnología anti-extracción de datos como SearchGuard y afirma que SerpApi encontró una forma de sortearla.

«Con las consultas automatizadas que envía, SerpApi incurre en una variedad de tergiversaciones y evasiones para eludir las protecciones tecnológicas implementadas por Google», explica la denuncia de Google. «Pero cada vez que emplea estos artificios, SerpApi viola la ley federal.»

SerpApi no está de acuerdo, insistiendo en que la acción legal de Google es simplemente un intento de proteger sus intereses comerciales.

La definición de medida de protección técnica de la DMCA es específica. Y según SerpApi, SearchGuard no cumple con esa definición.

«La DMCA define la elusión con precisión: significa ‘desencriptar una obra encriptada, descifrar una obra cifrada o, de otro modo, evitar, eludir, eliminar, desactivar o perjudicar una medida tecnológica'», afirma la empresa. «Léalo atentamente. Desencriptar. Descifrar. Perjudicar.»

SerpApi sostiene que no hace nada de eso, afirmando que accede a páginas web visibles públicamente, sin romper el cifrado, desactivar los sistemas de autenticación ni acceder a datos privados.

Para respaldar su argumento, la empresa cita hiQ Labs, Inc. v. LinkedIn Corp. y Impression Products, Inc. v. Lexmark International, casos que han confirmado la legalidad de la extracción de datos públicos y han negado la aplicabilidad de las disposiciones contra la elusión de la DMCA a obras públicas.

leer más  Steam Deck LCD: Fin de la producción y precio del modelo OLED

La solicitud de desestimación [PDF] de SerpApi argumenta que su extracción de datos web no es una elusión en virtud de la DMCA, al igual que la propia extracción de datos web de Google tampoco lo es.

«La DMCA previene la piratería informática: el ‘equivalente electrónico de entrar en una habitación cerrada con llave'», afirma la moción de la empresa. «…Pero Google no alega la desencriptación o el descifrado de ninguna obra, ni el deterioro, la desactivación o la eliminación de ningún sistema de acceso. Solo alega que SerpApi ‘resolvió’ desafíos de JavaScript o CAPTCHA o, de otro modo, imitó un navegador controlado por humanos de manera que ‘engañó’ a Google para que proporcionara resultados de búsqueda. Pero eso no es lo mismo que romper una cerradura o perforar una pared para obtener una copia de un libro. La imitación no es una violación.»

En enero, SerpApi presentó un argumento similar contra Reddit en su Memorándum de Derecho [PDF] que acompaña a su moción para desestimar la demanda de Reddit. La demanda enmendada [PDF] de Reddit, presentada a principios de este mes, sigue basándose en reclamaciones por violación de la DMCA.

Tori Noble, abogada del Electronic Frontier Foundation, declaró a The Register en un correo electrónico que la extracción de información pública es esencial para el funcionamiento de Internet.

«El derecho a extraer información disponible públicamente mantiene Internet libre y abierto», afirmó. «La DMCA socava la libertad de la web al disuadir la extracción legal de datos para la investigación, la expresión, la innovación y más. Cuando empresas como Google intentan basarse en interpretaciones excesivamente amplias de la DMCA para proteger sus modelos de negocio, todos sufren.»

leer más  Vulnerabilidad Urgente: Plugin WordPress User Registration o, alternativamente: Plugin WordPress User Registration: Riesgo de Acceso Admin o, más directo: Alerta: Vulnerabilidad Crítica en Plugin WordPress User Registration

Noble añadió: «SerpApi es un donante de EFF. Sin embargo, EFF se toma en serio su independencia y los donantes nunca guían nuestro trabajo, incluido el comentario sobre casos legales que entran dentro de nuestras áreas de interés.»

En relación con los litigios recientes relacionados con la recopilación de datos de IA, los tribunales se han mostrado reacios a limitar la extracción de datos web. En diciembre, el juez del Distrito de EE. UU. Sidney Stein rechazó [PDF] la solicitud de Ziff Davis de que el tribunal considerara que la infracción de las directivas robots.txt por parte de OpenAI durante su extracción de datos web era una elusión en virtud de la DMCA.

Dadas las importantes implicaciones financieras, la inaplicabilidad de las normas de derechos de autor para detener la extracción de datos competitiva parece que impulsará los esfuerzos por separar a los visitantes humanos de los bots. Pero con los bots de IA cada vez más hábiles en actividades autónomas y delegadas por humanos en línea, es difícil imaginar que los sitios web puedan mantener a los bots alejados con algo menos que acuerdos contractuales irrompibles o el tipo de autenticación completa prevista por la DMCA. ®

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.