.

IBM Research

Inteligencia Artificial

La IA de debate de IBM ya es capaz de ayudarnos a tomar decisiones

1

La nueva versión de Project Debater, entrenada mediante una técnica de inteligencia artificial llamada minería de argumentos, puede analizar muchas fuentes distintas para encontrar frases relacionadas con un tema, decidir si están a favor o en contra y usarlas para construir un argumento sólido.

  • por Douglas Heaven | traducido por Ana Milutinovic
  • 29 Enero, 2020

Aunque los ordenadores nos han guiado hasta la Luna y de vuelta, son incapaces de ayudarnos a tomar las decisiones más importantes a las que nos enfrentamos hoy en día. ¿Debería Donald Trump ser sometido a juicio y destituido de su cargo? ¿Debería Reino Unido abandonar la Unión Europea? ¿Debería Australia dejar de exportar combustibles fósiles? Aunque pueda parecerlo, este tipo de preguntas no pueden responderse con un simple sí o no.

Para tomar decisiones, sopesamos las ventajas y los inconvenientes de todas las opciones disponibles. Y este es un proceso en el que la inteligencia artificial (IA) podría ayudarnos con su capacidad de analizar los montones de datos que no paran de aumentar. De hecho, si queremos que la IA sea realmente útil, debería razonar más como lo hacemos nosotros. El investigador del Centro de Tecnología de Argumentos de la Universidad de Dundee (Reino Unido) Jacky Visser afirma: "Utilizamos un lenguaje persuasivo y todo tipo de conocimientos básicos que son muy difíciles de modelar en IA. Este ha sido uno de los santos griales desde que se empezó a pensar en la IA".

La principal técnica utilizada para ayudar a las máquinas a razonar se conoce como minería de argumentos y consiste en crear software para analizar documentos escritos de los que extraer frases clave como pruebas a favor o en contra de alguna afirmación. Luego, todas estas frases se pueden combinar para dar lugar a un argumento. Además de ayudarnos a tomar mejores decisiones, estas herramientas podrían usarse para encontrar noticias falsas (socavando las afirmaciones poco fiables y respaldando las factuales) o para filtrar los resultados de búsqueda online, destacando declaraciones relevantes en vez de documentos completos.

El trabajo de otros grupos en la minería de argumentos se ha centrado en tipos específicos de textos, como documentos jurídicos o trabajos académicos, que suelen tener una gran cantidad de argumentos estructurados. Eso resulta útil para crear un resumen de todas las pruebas presentes en muchos documentos diferentes en un caso judicial, por ejemplo. Pero el objetivo final consiste en construir un sistema capaz de rastrear tantas fuentes de información como sea posible y de crear un argumento a partir de todas las pruebas encontradas.

IBM acaba de dar un gran paso en esa dirección. El equipo de Project Debater de la compañía ha pasado varios años desarrollando una IA capaz de generar argumentos. El año pasado, IBM demostró su tecnología en desarrollo en un debate en directo contra el mejor participante de debates del mundo, en un enfrentamiento equivalente al del asistente Watson en el programa Jeopardy! Estos duelos son divertidos y ofrecen una prueba de concepto. Ahora IBM está convirtiendo su juguete en una herramienta realmente útil.

La versión del Project Debater que IBM usó en los debates en directo contaba con las capacidades básicas, como la de buscar en cientos de millones de artículos nuevos. Pero en los meses posteriores, el equipo ha modificado bastante las redes neuronales que utiliza, lo que ha mejorado la calidad de las pruebas que el sistema puede descubrir. Una ampliación importante es BERT, la red neuronal creada por Google para el procesamiento del lenguaje natural, que puede responder preguntas. El trabajo será presentado en febrero durante la conferencia de la Asociación para el Avance de la Inteligencia Artificial que se celebrará en Nueva York (EE. UU.).

Para entrenar su IA, el investigador principal, Noam Slonim, y sus colegas de IBM Research en Haifa (Israel) recurrieron a 400 millones de documentos de artículos de periódicos y revistas tomados de la base de datos LexisNexis. Esto les dio unos 10.000 millones de frases, es decir, un volumen lenguaje natural aproximadamente 50 veces mayor que Wikipedia. Combinaron este enorme conjunto de pruebas con las afirmaciones sobre varios cientos de temas diferentes, como "Donar sangre debería ser obligatorio" o "Deberíamos dejar de celebrar el Día de San Valentín".

Luego pidieron a los trabajadores de la plataforma Figure Eight que etiquetaran las frases en función de si proporcionaban pruebas a favor o en contra de las afirmaciones específicas. Los datos etiquetados se fueron introduciendo en un algoritmo de aprendizaje supervisado.

La red neuronal resultante es capaz de responder preguntas sobre una amplia variedad de temas, devolviendo frases que resultan más relevantes que las de los sistemas anteriores. Clasifica las frases que encuentra de acuerdo a su calidad como prueba. Por ejemplo, ante la afirmación "Donar sangre debería ser obligatorio", el software encontró la frase "Un estudio publicado en The American Journal of Epidemiology encontró que los donantes de sangre tienen un 88 % menos de riesgo de sufrir un ataque cardíaco y un derrame cerebral".

El gran desafío consiste en diferenciar las frases que ofrecen evidencias de las que no lo hacen, aunque contengan los mismos términos. Por ejemplo, para el tema de las donaciones, Project Debater también encontró una frase que decía: "Las estadísticas del Banco de Sangre de Nakasero muestran que los estudiantes son los principales donantes de sangre, contribuyendo con aproximadamente el 80 % de la sangre donada en todo el mundo". Sin embargo, el sistema no fue capaz de averiguar si dicha frase apoyaba el argumento o no.

Según Slonim, no está del todo claro por qué la red neuronal capta estas frases para hacer su clasificación. Aún así, cuando se probó, Project Debater logró un 95 % de precisión para las 50 frases más importantes en 100 temas diferentes. Para Slonim, "estos números son inauditos". Otros sistemas solo han conseguido abordar unas pocas docenas de temas. Las cifras también suponen un gran avance frente al sistema de debate en directo que Slonim mostró el año pasado.

Otros investigadores con los que hablé, incluidos Visser y Oana Cocarascu, que estudian software de argumentación y procesamiento de lenguaje natural en el Imperial College de Londres (Reino Unido), también quedaron impresionados con el nuevo sistema. Para Cocarascu, lo más fascinante es su potencial para aplicarse en el mundo real. Ningún sistema entrenado exclusivamente con documentos jurídicos podría hacer frente a los diferentes tipos de pruebas que se encuentran online. El equipo de Slonim ha demostrado que Project Debater es capaz de manejar esta amplia gama de fuentes. "Eso es lo que lo hace genial", asegura Cocarascu.

El equipo está publicando ahora sus datos de entrenamiento para que otros puedan usarlos. Visser quiere crear herramientas de minería de argumentos como Project Debater capaces de evaluar la calidad de los argumentos, buscando el sesgo cognitivo, por ejemplo. El equipo también ha utilizado la inteligencia artificial para valorar la calidad de los argumentos en los debates presidenciales de EE. UU. en 2016.

IBM está haciendo algo similar. A través de un complemento, llamado Speech by Crowd, Project Debater puede reunir argumentos de los participantes a favor y en contra de una propuesta y evaluar automáticamente su calidad utilizando una red neuronal entrenada en un conjunto de datos de alrededor de 30.000 argumentos previamente calificados por humanos.

IBM planea ofrecer Project Debater a empresas y gobiernos. El portavoz de la compañía, Christopher Sciacca afirma: "Vemos el futuro de Project Debater como un servicio de inteligencia artificial en la nube". En una aplicación que sirvió como ejemplo, IBM recolectó 3.500 opiniones de ciudadanos de Lugano (Suiza) sobre si la ciudad debería invertir en vehículos autónomos y usó la IA para extraer y evaluar los argumentos a favor y en contra de la propuesta. El Gobierno local podría usar esos resultados como ayuda para tomar una decisión definitiva. 

Pero para Slonim, se trata de mejorar nuestra interacción con la IA a nivel personal. El argumento tiene un papel importante en la forma en la que las personas se comunican: enumeramos las razones de nuestras decisiones, pedimos consejo, persuadimos y convencemos a los demás. Hablar con asistentes virtuales capaces de conversar a ese nivel resultaría mucho más natural. El responsable concluye: "Lo que hacemos es fundamental para nuestras vidas. Estamos intentando vincular las tecnologías de comprensión del lenguaje para ayudar a las personas a tomar mejores decisiones".

Inteligencia Artificial

 

La inteligencia artificial y los robots están transofrmando nuestra forma de trabajar y nuestro estilo de vida.

  1. La pandemia acelera los despidos y la automatización de los 'call centers'

    La necesidad de reducir personal y la avalancha de llamadas asociadas al coronavirus ha impulsado la adopción de inteligencia artificial en servicios de atención al cliente mediante chatbots y sistemas por voz. Aunque esos puestos de trabajo podrían desaparecer para siempre, los clientes parecen encantados

  2. La IA, incapaz de predecir nuestros súbitos cambios de comportamiento

    Ninguna inteligencia artificial está entrenada para que una semana agotemos el papel higiénico y las mascarillas y la siguiente, la levadura y los productos de jardinería. Los algoritmos de gigantes como Amazon y Netflix deben reajustarse manualmente para abordar la volatilidad de nuestros patrones de conducta durante la pandemia

  3. La COVID-19 acelera el uso de la IA médica, con riesgos y beneficios

    Ante la escasez de recursos, cada vez más hospitales están usando inteligencia artificial para cribar a los pacientes a través de sus radiografías de tórax. Los algoritmos que funcionan bien están ayudando mucho a los profesionales, pero también hay empresas que intentan aprovecharse de la desesperación de los médicos