.

Computación

El problema de nuestra obsesión por los datos

1

La recogida incansable de información puede hacer que nos equivoquemos en nuestras valoraciones y tengamos un exceso de confianza respecto a lo que sabemos.

  • por Brian Bergstein | traducido por Lía Moya (Opinno)
  • 18 Marzo, 2013

Una polémica pregunta de las votaciones de California de 2008 inspiró una sencilla innovación en línea: una página Web llamada Eightmaps.com. El número ocho del nombre de la página se refiere a la Proposición, que pedía una enmienda en la constitución del estado para prohibir el matrimonio homosexual. Cumpliendo con las leyes de financiación de partidos de California, todas las donaciones superiores a 100 dólares (unos 75 euros) a grupos haciendo campaña a favor o en contra de la Proposición 8 se registraron en una base de datos de acceso público. Alguien (aún no está claro quién) cogió todos los datos sobre los defensores de la propuesta -sus nombres y códigos postales y en algunos casos el nombre de las empresas para las que trabajaban- y los colocó sobre un mapa de Google.

Después de aparecer en el mapa, varios defensores de la prohibición del matrimonio homosexual afirmaron haber sido acosados o haber sufrido un boicot a sus empresas. Este hecho disgustó incluso a algunos detractores de la Proposición 8; afirmando que los fundamentalistas religiosos no tardarían mucho en crear una herramienta parecida para destacar quienes defendían una medida a favor de los derechos de los homosexuales. El comité que había respaldado la Proposición 8 pidió a un juez federal que derogara la ley de transparencia, o que subiera el umbral por encima de los cien dólares para que más gente pudiera donar de forma anónima. Pero el juez se negó, argumentando que los temas a decidir en referéndum necesitan la "luz" que da el revelar los datos sobre los donantes. Su sentencia se alinea con la idea de que todos los datos posibles sobre el proceso político se deben revelar.

A Evgeny Morozov le preocupa que aceptamos este compromiso de decidir publicar más información para aumentar la transparencia aunque la publicación socave principios como la intimidad o la implicación cívica. En su mordaz libro recién aparecido,  To Save Everything Click Here (Para guardarlo todo, haz clic aquí), Morozov, que escribe en Slate y The New Republic, usa el episodio de Eightmaps para respaldar su afirmación de que el "Internetcentrismo" está deformando nuestra visión de lo que verdaderamente importa.

La transparencia sube puestos a expensas de otros valores, sugiere Morozov, principalmente porque es tan barato y fácil usar Internet para distribuir datos que podrían resultar útiles en algún momento. Y como se nos repite tanto que Internet nos ha librado de los controles que los "guardianes" tenían sobre la información, repensar la disponibilidad de información parece retrógrado, y la tendencia hacia la transparencia gana aún más fuerza. (Nótese que Facebook afirma que su misión es "hacer que el mundo sea más abierto y transparente”).

Morozov no es el único que teme un exceso de transparencia. El profesor de La Universidad de Harvard (EE.UU.) Lawrence Lessig ha descrito elocuentemente por qué es más probable que tener más datos sobre los políticos conduzca a la gente al cinismo antes que a mejorar la política. Pero Lessig parece resignado a la inevitabilidad de este tipo de proyectos de recogida de datos en la era de Internet. Cree que la solución es la financiación pública de las elecciones, así la gente tendrá menos motivos para ser cínicos respecto a las motivaciones de sus legisladores.

Este argumento enfurece a Morozov, porque cree que Lessig se limita a dar continuidad a un error de base, que Internet es como una fuerza de la naturaleza y no un invento humano y que resistirse es inútil. Al contrario, afirma Morozov, hay que resistirse. Su respuesta al problema planteado por Eightmaps no es limitarse a aceptar que habrá más información fácilmente disponible y buscable, y cambiar la ley en consecuencia, sino que cree en cambio que deberíamos exigir que nuestros sistemas en línea respeten valores más allá de la mera transparencia. Las bases de datos de donativos para las campañas, por ejemplo, se podían diseñar de tal forma que no se pudieran sacar registros en masa de las mismas. Sí, es cierto que eso impediría algunos descubrimientos fáciles de datos, pero podría potenciar la democracia a largo plazo haciendo que la gente se sienta más libre para apoyar causas que podrían ser impopulares en su barrio o su oficina. 

El primer libro de Morozov, The Net Delusion: The Dark Side of Internet Freedom (El desengaño de Internet, publicado en español por Destino), buscaba romper con el mito de que los medios sociales son una potente arma contra las dictaduras. En él, Morozov afirmaba que era al contrario: los regímenes astutos usan la Web para mantener controlados a los disidentes. Algo que desde luego parece ser cierto en China, Siria e Irán. En su nuevo libro intenta desinflar una idea más amorfa: el "solucionismo". Es el término que ha acuñado para describir la creencia de que con datos suficientes sobre muchos aspectos complejos de la vida -incluyendo no solo la política, sino también el crimen, el tráfico y la salud-, podemos arreglar problemas de ineficiencia. Por ejemplo, ahora hay software predictivo que analiza las estadísticas de crímenes y ayuda a la policía a decidir dónde reforzar las patrullas. Hay algoritmos que hacen un seguimiento de los clics en los sitios web y avisan a los periodistas sobre qué clase de noticias escribir. Morozov cree que esto puede salir terriblemente mal por muchos motivos. Para empezar, la eficiencia máxima no es necesariamente un valor a lograr; con frecuencia la ineficiencia produce beneficios sociales. No saber exactamente cuántos lectores ha tenido cada noticia probablemente llevó a los periódicos ha cubrir ampliamente el gobierno estatal.

Arrogancia tecnológica

Pero el problema potencial más escalofriante es que los datos que usamos para guiarnos pueden estar incompletos o ser demasiado reduccionistas. Muchos crímenes quedan sin denunciar, lo que podría llevar al software predictivo a pensar que un barrio es seguro. Sin embargo, los policías de patrulla pueden saber cuándo las cosas no van del todo bien en el barrio y estar atentos. Morozov teme un futuro en el que este tipo de "conocimiento intuitivo" sobre cómo desplegar los recursos se vea dominado por algoritmos que solo son capaces de trabajar con datos puros y no tengan en cuenta, evidentemente, los datos que les faltan. De forma parecida, los registros en línea de los donativos de campaña de alguien podrían parecer detallados y por lo tanto instructivos, pero siempre ofrecerán como mucho una información parcial sobre las creencias de esa persona o su papel en el proceso político.

Este concepto quizá sea el punto fuerte del argumento de Morozov: por muy objetivos que sean los datos, la interpretación siempre es subjetiva y también lo es nuestra elección a la hora de decidir qué datos recoger para empezar. Aunque podría parecer evidente que los datos, por muy "grandes" que sean no son capaces de representar perfectamente la vida en toda su complejidad, la tecnología de la información produce tanta información que es fácil olvidarse de toda la que falta.

Y no es un problema nuevo; las cualidades engañosas o incluso cegadoras de los grandes datos plagaron a los primeros usuarios de la computación a gran escala. Durante la guerra de Vietnam, el ejército de Estados Unidos quiso impedir que Vietnam del Norte usara la ruta Ho Chi Mihn, un sistema de caminos por la jungla a través del vecino Laos, para mandar suministros a la insurgencia comunista del sur. Robert S. McNamara, Secretario de Defensa en aquellos momentos, que había usado métodos de gestión cuantitativos cuando dirigió Ford Motor, hizo lo que le parecía más natural: buscar más datos  sobre lo que pasaba en la ruta. Así empezó la Operación Iglú Blanco. Desde 1967 y hasta 1972, aviones americanos volaron sobre la ruta y descargaron 20.000 sensores con batería que parecían plantas o madera, pero eran capaces de detectar voces y otros sonidos, calor corporal, orina y las mediciones sísmicas específicas de los camiones. Estos sensores mandaban señales a los aviones estadounidenses, que reenviaban los datos a un centro de mando de Estados Unidos en Tailandia, donde técnicos sentados en bancos delante de sus terminales observaban mapas de la ruta Ho Chi Mihn. Cuando un sensor detectaba algo, esa sección de la ruta se encendía como un gusano blanco. Los ordenadores IBM 360/65 del centro de mando calculaban la velocidad a la que se movía el gusano; esa información se mandaba por radio a los bombarderos estadounidenses para que la zona en cuestión se pudiera atacar.

Desde el centro de control, Iglú Blanco debía de tener muy buena pinta. Aparecían gusanos en las pantallas y desparecían en los bombardeos. Los datos parecían indicar que los estadounidenses habían destruido miles de camiones e interrumpido rutas que entregaban cantidades significativas de suministros. El ejército estaba tan contento que no le importó gastar 1.000 millones de dólares anuales en el programa (unos 750 millones de euros).

Pero investigadores del congreso acabarían por dudar de las suposiciones del Pentágono respecto a cuántos camiones se habían bombardeado. Los comunistas no habían dejado de enviar suministros hacia el sur. Llegaron a enviar los tanques que se usaron en una inmensa ofensiva que tuvo lugar en el sur en 1972. Resultó que los estadounidenses no se dieron cuenta de hasta qué punto ellos y sus máquinas IBM estaban actuando partiendo de datos incompletos y poco fiables. Para empezar, no podían cubrir toda la ruta con sensores. Y los vietnamitas aprendieron a engañar al sistema con bolsas de orina y sonidos de camiones grabados.

Podría resultar tentador descartarlo como otra metedura de pata absurda en una guerra llena de ellas. Pero estaríamos dejando de lado un punto clave. La lección no es que la tecnología de recogida de datos de Iglú Blanco fuera limitada -aunque lo fuera- sino que la gente que usaba los datos no comprendía sus limitaciones. En su libro de 1996 The Closed World (El mundo cerrado), el historiador Paul N. Edwards describe Iglú Blanco como un ejemplo de arrogancia tecnológica. Los analistas militares creyeron que los ordenadores y las comunicaciones en tiempo real les permitirían crear una "cúpula de vigilancia tecnológica global" que proporcionara una certeza cada vez mayor sobre lo que sucedía en el mundo. Pero hay muchas cosas que no encajan limpiamente bajo esa cúpula: la vida es un follón y no todo se puede abstraer en forma de datos para que los ordenadores actúen sobre ellos.

En la actualidad los datos tienen otro aspecto, pero nuestra fe en su valor -y el impulso por crear un panóptico de información- sigue ahí, testaruda. Google afirma que quiere "organizar la información del mundo y hacer que sea universalmente accesible y útil". Morozov tiene razón al cuestionar si es un objetivo valioso. ¿Quién sabe qué proyectos de análisis de datos llevados a cabo en la actualidad nos parecerán tan estrechos de miras dentro de 40 años como nos parece Iglú Blanco ahora?

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. ‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU

    Al conectar varios chips menos avanzados en uno, las empresas chinas podrían eludir las sanciones impuestas por el gobierno estadounidense.

  2. Esta ciudad china quiere ser el Silicon Valley de los ‘chiplets’

    Wuxi, el centro chino del envasado de chips, está invirtiendo en la investigación de ‘chiplets’ para potenciar su papel en la industria de semiconductores

  3. La computación cuántica se abre camino a través del ruido

    Durante un tiempo, los investigadores pensaron que tendrían que conformarse con sistemas ruidosos y propensos a errores, al menos a corto plazo. Esto está empezando a cambiar.

    Jay Gambetta dirige el desarrollo de los ordenadores cuánticos de IBM y lideró la iniciativa de llevar estos sistemas a la nube.