Otros

Esta página desenmascara a tus 'followers' robóticos

El diferente comportamiento entre las cuentas automatizadas y las humanas permite distinguirlas

por The Physics Arxiv Blog | traducido por Francisco Reyes
11 Agosto, 2014

En 2011 un equipo de la Universidad A&M de Texas (EEUU) creó una cibertrampa para atrapar a usuarios de Twitter no humanos dedicados a contaminar la tuitesfera con spam. El método consistió en crear cuentas "cebo" con contenido sin sentido en las que ningún usuario humano podría estar interesado. Cualquier cuenta que retuiteara este contenido, o se hiciera amigo del propietario, seguramente sería un usuario no humano, o robot social.

El equipo creó 60 cebos y cosechó unas 36.000 cuentas robóticas potenciales. La gran cantidad de cuentas no humanas activas sorprendió a muchos observadores. Estos robots en general eran poco sofisticados y se limitaban a retuitear prácticamente cualquier contenido que encontraban.

Desde entonces los robots sociales han avanzado muchísimo. Analizan las redes sociales en busca de las personas más populares e influyentes, luego las siguen y captan su atención mediante el envío de mensajes. Estos robots pueden identificar palabras clave y encontrar contenido en consecuencia, y algunos incluso pueden responder a preguntas usando algoritmos de lenguaje natural.

Eso hace que la identificación de los robots sociales sea mucho más difícil. Sin embargo Emilio Ferrara y varios colegas de la Universidad de Indiana en Bloomington (EEUU) aseguran haber desarrollado una forma de detectar sofisticados robots sociales y distinguirlos de los usuarios humanos normales.

La técnica es relativamente sencilla. Empezaron reuniendo un conjunto de robots sociales del grupo original identificado en 2011. Eligieron 15.000 y recogieron sus 200 tuits más recientes, además de los 100 tuits más recientes en los que son mencionados. Eso produjo un conjunto de datos de unos 2,6 millones de tuits. Después el equipo reunió un conjunto de datos similar a partir de 16.000 usuarios humanos y consistente en más de 3 millones de tuits.

Por último los investigadores crearon un algoritmo llamado 'Bot or Not?' para analizar los datos en busca de diferencias significativas entre las propiedades de los usuarios humanos y los robots sociales. El algoritmo consideró más de 1.000 características asociadas a estas cuentas, como el número de tuits y retuits que publicó cada usuario, el número de respuestas, menciones y retuits que recibió cada uno, la longitud del nombre de usuario e incluso la antigüedad de la cuenta.

Resulta que hay diferencias significativas entre las cuentas humanas y las de robots. Los robots tienden a retuitear con mucha más frecuencia que los humanos. Además también tienen nombres de usuario largos y cuentas más recientes. Por el contrario, los seres humanos reciben más respuestas, menciones y retuits.

En conjunto estos factores crean una especie de huella digital que se puede utilizar para detectar los robots. "'Bot or Not?' tiene una precisión de detección muy prometedora", señalan Ferrara y su equipo.

Sin embargo existen algunas limitaciones. En primer lugar, el equipo tomó los robots sociales identificados originalmente en 2011 por lo que es muy posible que hoy día existan robots más avanzados y menos fáciles de detectar.

También hay casos ambiguos que contienen mensajes de seres humanos y robots sociales, por ejemplo cuando los humanos prestan sus cuentas a robots, o cuando las cuentas han sido hackeadas por robots. "Detectar estas anomalías es imposible hoy día", admite Ferrara.

Es un interesante comienzo dentro del proceso de identificación de robots sociales, aunque es una tarea que podría hacerse más difícil con el tiempo. Con sólo 140 caracteres, el tipo de comunicación posible en Twitter tiene limitaciones significativas. Por tanto es mucho más fácil para un ordenador recrear el comportamiento altamente limitado que los humanos demuestran en este espacio.

Para los interesados, Ferrara y su equipo han hecho que el algoritmo 'Bot or Not?' esté disponible en este sitio web. Después de introducir el nombre del usuario de Twitter, el algoritmo analiza sus características y mensajes más recientes para determinar la probabilidad de que sea un robot social.

No funcionaba en el momento de escribir este artículo, así que tal vez haya sido víctima de algún robot social enfadado. Pero si ves que ahora funciona, pruébalo y dinos lo que piensas en la sección de comentarios de más abajo.

Ref: http://arxiv.org/abs/1407.5225 : The Rise of Social Bots

Otros

Esta página desenmascara a tus 'followers' robóticos

De la llegada a la Luna al desarrollo de la IA: el papel de las universidades en la innovación

Es hora de jubilar el término "usuario"

Elevar tu casa o abandonarla: el dilema del cambio climático en Luisiana