.

Computación

Los moderadores de Wikipedia solo actúan frente al 10% de los abusos

1

Un nuevo conjunto de más de 13.500 ataques personales podría ayudar a entrenar algoritmos para acabar con los ataques y la hegemonía del hombre blanco en sus foros de debate

  • por Tom Simonite | traducido por Teresa Woods
  • 16 Febrero, 2017

Foto: Una visualización de actualizaciones en páginas de debate de Wikipedia en enero muestra la incidencia de ataques personales, señalados en rojo. Crédito: Jigsaw (Wikimedia Commons).

Misoginia, racismo, obscenidades.... eso es lo que incluye un conjunto de más de 13.500 ataques personales en internet.

Esta base de datos de mensajes desagradables proviene de las páginas de debate de Wikipedia. La colección, junto a otras más de 100.000 actualizaciones neutras, ha sido publicada por los investigadores de Alphabet y la Fundación Wikimedia, la organización sin ánimo de lucro responsable de Wikipedia. Las entidades afirman que los datos ayudarán a mejorar los trabajos para entrenar a un software para que comprenda y supervise el acoso en línea.

El director de investigaciones científicas de Jigsaw, un grupo dentro de Alphabet que desarrolla tecnologías al servicio de causas como la libertad de expresión y la lucha contra la corrupción, Lucas Dixon, explica: "Nuestro objetivo consiste en averiguar cómo podemos ayudar a la gente a debatir de manera productiva sobre los temas más controvertidos e importantes"

Investigadores de Jigsaw y Wikimedia utilizaron un servicio de crowdsourcing para estudiar más de 115.000 mensajes publicados en las páginas de debate de Wikimedia. Querían detectar cualquier comentario que representara un ataque personal según la definición de las reglas de la comunidad. Los colaboradores ya han utilizado los datos para entrenar algoritmos de aprendizaje automático que igualan el rendimiento de los trabajadores de crowdsourcing en la identificación de ataques personales. Cuando los alimentaron con la colección completa de 63 actualizaciones de debate hechas por editores de Wikipedia, descubrieron que los moderadores solo actuaron en el 10% de los ataques.

Reducir los acosos entre editores de Wikipedia se convirtió en una prioridad de la Fundación Wikimedia el año pasado. Esta política se suma a esfuerzos existentes de suavizar el ambiente espinoso y burocrático de la comunidad Wikipedia, el cual limita la participación de nuevos editores. Ambos problemas podrían ayudar a explicar por qué cada vez hay menos y por qué la plataforma no ha conseguido más participación que no proceda de su segmento poblacional principal: los hombres occidentales (ver La agonía de Wikipedia).

Jigsaw y la Fundación Wikimedia no son los primeros en estudiar el acoso en internet, ni son los primeros que intentan diseñar software capaz de detectarlo y combatirlo. Lo que no era tan común era disponer de una colección semejante de comentarios etiquetados para identificar las actualizaciones abusivas y las que no. Para ello, es necesario entrenar algoritmos de aprendizaje automático, según el investigador de ciencias de datos de la Fundación Wikimedia Ellery Wulczyn.

El responsable calcula que este conjunto de ataques personales y comentarios de Wikipedia es entre 10 y 100 veces más grande que los anteriores. Y ya se sabe que los algoritmos de aprendizaje automático necesitan grandes cantidades de ejemplos etiquetados para aprender a filtrar datos con precisión.

Aún no está claro si los algoritmos entrenados para detectar abusos podrán hacer de moderadores eficaces. Al software aún le falta mucho para entender todos los matices del lenguaje. Algunas personas podrían intentar afinar su lenguaje abusivo para evadir la detección, según Wulczyn de Wikimedia. "Si quisiéramos desarrollar un tipo de intervención con la que los humanos fuéramos a mantener un enfrentamiento, no sabemos qué pasaría", concluye.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Las estrategias de los hackers para sacar provecho del coronavirus

    Gobiernos, empresas y particulares permanecen atentos a cualquier información, y los ciberdelincuentes se están aprovechando de ello. Su principal ataque consiste en enviar correos informativos que parecen proceder de fuentes fiables, como la OMS y los CEO, junto a archivos maliciosos que infectan los ordenadores

  2. Todo lo que se sabe de la carrera por crear el mejor ordenador cuántico

    IBM utiliza cúbits ajustables, que son más fiables, para duplicar su volumen cuántico cada año. Por su parte, Google con sus rápidos cúbits de frecuencia fija, trabaja en la supremacía cuántica. Cada enfoque y cada compañía tiene sus propias ventajas y desventajas, y nadie sabe quién acabará ganando

  3. Ha llegado la hora de que cunda el pánico por el fin de la ley de Moore

    La mayoría de las tecnologías que gobiernan la economía actual se basa en chips cada vez más pequeños y potentes. Pero, a pesar de algunas ingeniosas estrategias, cada vez es más difícil que sigan aumentando su velocidad. O empezamos a invertir en I+D ahora o las industrias no podrán seguir avanzando