Innovateurs De Moins De 35 Mexico La edición en español de
MIT Technology Review elige a los 10
innovadores menores de 35

Caleb Rascón, 32

Ha creado un sistema de audición robótica capaz de detectar y ubicar varias fuentes sonoras con un menor número de micrófonos

Universidad Nacional Autónoma de México

Caleb Rascón (Crédito: Varinia Margarita Estrada García)

Si cerramos los ojos durante unos segundos, la oscuridad da paso poco a poco a una escena mental que el cerebro conforma con información, sobre todo, auditiva. Esta permite identificar y ubicar a alguien que da una orden, un ventilador que gira en segundo plano, música, y el llanto de un niño, amortiguado, en la habitación de al lado, por ejemplo.

Todos estos matices que forman parte de la escena auditiva son muy difíciles de captar e interpretar por inteligencias no humanas. Aunque hay programas de reconocimiento de voz, como Dragon, o de procesamiento de lenguaje natural, como el que utiliza Siri, que son capaces de registrar parcialmente esta información (el contenido de conversaciones u órdenes), gran parte de la escena se les escapa.

Para el joven investigador mexicano Caleb Rascón, esta limitación ilustra la existencia de un reto en el campo de la audición robótica que, de ser superada, mejoraría mucho la calidad de la interacción entre humanos y máquinas. Este es un aspecto crítico para Rascón y su equipo de la Universidad Nacional Autónoma de México, el Grupo Golem, que está creando un robot de servicio que actúa como un mayordomo electrónico. Entre otras tareas, su mayordomo Golem II+ atiende peticiones, se desplaza y mueve objetos bajo demanda. Como interactúa continuamente con personas, es esencial que sea "lo más humano posible" en su forma de comportarse, pero también en su forma de escuchar.

Tal y como explica Rascón, las personas se sienten más cómodas con un mayordomo que se gira para mirarles a la cara cuando hablan y que es capaz de adaptar su comportamiento de forma natural y reaccionar frente a varios estímulos auditivos simultáneos. Por ello, una de las pruebas a las que han sometido al robot consiste en manejar una situación en la que dos personas intentan llamar su atención a la vez. El resultado esperado (y alcanzado por Golem II+) es que sea capaz de identificar diferentes fuentes acústicas y atenderlas siguiendo los mismos patrones de cortesía que respetaría un camarero humano.

Para lograrlo, en primer lugar, el robot necesita identificar lo que están diciendo las personas mediante reconocimiento de voz; pero también debe detectar quién está hablando y si las fuentes que emiten sonidos están cerca o más alejadas. Por otro lado, los sistemas de reconocimiento de voz, que funcionan bien en teléfonos móviles, necesitan que el micrófono esté situado muy cerca de la boca del hablante. Sin embargo, Golem II + debe reconocer órdenes emitidas desde lejos, con los micrófonos que lleva incorporados. En esta circunstancia el rendimiento del reconocedor de voz cae en picado, afectado por el ruido y la reverberación.

Unas orejas robóticas ligeras

Para afrontar todos estos retos, Rascón ha desarrollado un módulo de hardware y software para Golem II+ que supera las posibilidades que ofrece un reconocedor de voz por sí solo y ayuda al robot a adaptarse a la escena auditiva completa. Pero además, lo ha hecho usando una configuración de hardware muy ligera, es decir, con un número reducido de micrófonos y sin unos requerimientos de poder de cómputo demasiado elevados.

La audición robótica lleva aparejados varios procesos: detectar las fuentes de sonido, ubicarlas, separarlas y realizar un reconocimiento de voz adecuado. En lo que respecta a la identificación del número de fuentes y su dirección, la gran mayoría de los algoritmos actuales usan sistemas de análisis estadístico que están limitados por el número de micrófonos instalados en el robot. Esto significa que no pueden detectar un número de fuentes superior al número de que micrófonos que lleven incorporados. El sistema diseñado por Rascón, sin embargo, es capaz de detectar hasta cuatro fuentes de sonido -humanas y electrónicas- con solo tres micrófonos, y de hacerlo en un entorno de condiciones acústicas poco favorables y reverberación moderada.

Actualmente su equipo está trabajando en el siguiente paso, la separación de las fuentes en el ambiente, un punto que otros sistemas de audición robótica creados en Japón y Canadá ya han alcanzado. Sin embargo -recuerda Rascón- todos ellos necesitan más del doble de micrófonos que Golem II+ para funcionar en condiciones reales.

Es tentador pensar que la solución al reto de la audición robótica pasaría simplemente por añadir más micrófonos. Pero pese a los avances en miniaturización de estos aparatos, la calidad de la señal de audio de un micrófono de menor tamaño decrece al ser más pequeño su diafragma. Además, para compensar esa pérdida de calidad, es necesario realizar un procesamiento de la voz intenso.

Por este motivo, la alternativa ligera de Rascón resulta ventajosa. No solo reduce el coste y el hardware que debe cargar el robot, sino que abre interesantes posibilidades en otros campos, como la mejora de audífonos. "La cantidad de micrófonos que pueden colocarse en un dispositivo tradicional de asistencia auditiva es poca", recuerda Rascón. "Antes de limitarnos a añadir más al robot, debemos desafiarnos a explorar este camino y ver si podemos resolver los dos problemas a la vez: dar capacidad auditiva al robot de servicio con la menor cantidad de micrófonos y trasladar ese conocimiento a la mejora de estos dispositivos de asistencia", añade el innovador.

Otra área que podría beneficiarse de estos avances en audición robótica es la bioacústica. Rascón anticipa, por ejemplo, la posibilidad de realizar un censo de animales a través de la señal captada con micrófonos instalados en sus hábitats, sin necesidad de capturar especímenes ni poner en peligro al humano, y de forma más rápida y barata.

Para el responsable del Grupo de Bioingeniería del CSIC (España), Ramón Ceres, que es miembro del jurado de los premios MIT Technology Review Innovadores menores de 35 México, Rascón posee "un excelente currículum, con la tesis doctoral realizada en un centro de prestigio, publicaciones y distinciones diversas", y lidera un proyecto "científicamente relevante" que "apunta a aplicaciones de gran proyección social". – Elena Zafra

Ganadores de Innovadores menores de 35 México 2014

Caleb Rascón

Ha creado un sistema de audición robótica capaz de detectar y ubicar varias fuentes sonoras con un menor número de micrófonos

Fernando Rojas

Ha creado un sistema informático de seguimiento y evaluación de riesgo a distancia para embarazadas

Blanca Lorena Villarreal

Ha creado una nariz robótica capaz de detectar y seguir con rapidez la trayectoria de una fuente de olor

Para comentar, por favor accede a tu cuenta o regístrate

¿Olvidaste tu contraseña?

Advertisement
Advertisement
Publicidad