.

Ms Tech | Pixabay

Tecnología y Sociedad

'Web scrapping', la técnica para denunciar injusticias y que es delito a la vez

1

La película 'Juegos de guerra' hizo que las autoridades de EE. UU. crearan una ley contra la piratería informática que convirtió el raspado web en un crimen. Pero, como periodista, afirmo que es una de las herramientas más poderosas que tengo para identificar responsabilidades de empresas y gobiernos

  • por Lam Thuy Vo | traducido por Ana Milutinovic
  • 21 Diciembre, 2020

Como periodista con algunas nociones de informática, me resulta fácil encontrar información en páginas web y redes sociales para algún reportaje. Lo único que tengo que hacer es escribir unas líneas de código, introducirlas en la red y abrir páginas web para descargar los datos disponibles públicamente en ellas. Este proceso se llama web scraping, o raspado web. 

Pero, cada vez que comienzo a investigar alguna historia que requiere web scraping me paro a pensar: "¿Vale la pena ir a la cárcel por esto?"

No me refiero a hackear las amuralladas bases de datos de la CIA, sino de usar el código informático para reunir información a la que puedo acceder libremente como cualquier usuario de internet, como, por ejemplo, las publicaciones abiertas de Instagram o los tuits que usan un determinado hashtag.

Mi preocupación no es infundada. La vagamente escrita Ley de Delito y Fraude Informático de EE. UU. convierte en un posible delito el acceso a este tipo de información de manera programada. La ley, que ya tiene varias décadas, se introdujo después de que los legisladores vieran la película Juegos de guerra (título original: WarGames) de 1983 y decidieran que Estados Unidos necesitaba una ley contra la piratería. Así fue como prohibieron que cualquier persona usara un ordenador "sin autorización o sobrepasara el acceso autorizado". 

Si bien la ley pudo haber tenido buenas intenciones y se ha utilizado para denunciar a quienes descargan algo que no deberían, también atrapa en su amplia red a muchas otras personas, incluidos profesores universitarios, investigadores, y periodistas. 

¿Qué significa "sobrepasar el acceso autorizado" en la era de las redes sociales? ¿Un empleado que tiene acceso a una base de datos de revistas de investigación para su trabajo y las usa para fines privados sobrepasa el acceso autorizado? ¿Comete un delito una reportera como yo que busca información mediante procesos automatizados y su propia cuenta de Facebook?

Hasta ahora, las interpretaciones de la ley han variado de un caso judicial a otro, en función de los distintos jueces para una mejor definición de lo que significa exactamente sobrepasar el acceso autorizado a la información. Pero, pronto El Tribunal Supremo de Estados Unidos se pronunciará sobre esta ley por primera vez, en el caso Van Buren contra Estados Unidos. El sargento de policía Nathan Van Buren tenía acceso a bases de datos confidenciales para su trabajo y vendió la información que encontró a un tercero. El tribunal escuchó los argumentos iniciales el 30 de noviembre y podría comunicar su decisión pronto.

Es posible rastrear muchas irregularidades corporativas a través de las plataformas en las que llevamos gran parte de nuestras vidas, desde los precios injustos en Amazon hasta los discursos de odio en Facebook. Y la enorme huella digital que los seres humanos producimos online, de la cual casi toda está disponible públicamente, puede ayudarnos a cubrir las lagunas en los datos e investigar áreas que, de otro modo, serían difíciles de entender.

Como señaló la artista y experta en tecnología Mimi Onuoha en su conmovedora obra The Library of Missing Datasets: "Lo que ignoramos revela más que aquello a lo que prestamos atención. Es ahí donde encontramos indicios culturales y cotidianos de lo que se considera importante. Los espacios que hemos dejado en blanco revelan nuestros sesgos sociales ocultos e indiferencias".

La recopilación de datos es costosa y complicada, pero también es una herramienta importante para descubrir y revelar las injusticias sistémicas. Qué datos consideramos lo suficientemente importantes para reunir es un asunto que a menudo se deja en manos de poderosas entidades (gobiernos y corporaciones) que no siempre tienen en cuenta a las personas más vulnerables de la sociedad.

Si los funcionarios del Gobierno chino no quieren publicar información sobre los campamentos donde retienen a las minorías musulmanas, entonces quizás los investigadores puedan usar la información de los mapas de Google para mostrar el alcance de este problema. Si los perpetradores no admiten sus crímenes de guerra, pero, publican sobre ellos en las redes sociales, los fiscales y los investigadores de derechos humanos aún pueden construir casos en su contra. 

¿Deberían las empresas como Facebook tener el recurso legal para paralizar una investigación académica? ¿Debería haber una exención cuando el web scraping es la única forma de recopilar datos que ayudan a los investigadores, profesores universitarios y periodistas a diagnosticar los males de nuestra sociedad?

Twitter podría haber creado un camino a seguir. Teniendo en cuenta su papel en la difusión de desinformación en torno a las elecciones estadounidenses de 2016, la empresa decidió crear un acceso especial a los datos específicamente para académicos e investigadores. Aunque la empresa aún desaprueba el scraping, este paso indica que reconoce la importancia de los datos. 

Quizás los legisladores también lo hagan. 

*Lam Thuy Vo es periodista sénior en 'BuzzFeed News', donde ha publicado artículos sobre desinformación, odio en línea y responsabilidad relacionada con la plataforma. Su libro 'Mining Social Media' fue publicado por No Starch Press a fines de 2019.

Tecnología y Sociedad

Los avances tecnológicos están cambiando la economía y proporcionando nuevas oportunidades en muchas industrias.

  1. Guía ética para identificar a los asaltantes del Capitolio desde casa

    El ataque fue la gota que colmó el vaso para muchos ciudadanos, que se han convertido en detectives aficionados 'online' para descubrir la identidad de los perpetradores. Pero, por muy buenas que sean sus intenciones, su labor puede incurrir en distintos delitos, y pueden sufrir amenazas y problemas psicológicos

  2. El ciclo sin fin de la IA racista empieza en los datos y acaba en las personas

    Se dice que los datos nunca mienten pero la realidad es que los diseñadores de inteligencia artificial usan conjuntos sesgados que corrompen los sistemas que luego se aplican en el mundo real. Los tecnólogos deben asumir su responsabilidad sobre la inclusión de ideologías tóxicas en los algoritmos

  3. Dentro de NSO, el multimillonario gigante de software espía de Israel

    Las crecientes pruebas de que su producto Pegasus se usa para violar derechos humanos lo han obligado a ser más transparente, pero la información que comparte solo genera más preocupación, y aunque su argumento de que no es responsable de lo que sus clientes hagan se tambalea, no hay regulación capaz de frenar los abusos que permite