.

Computación

“La interacción con nuestros dispositivos es cada día más humana y menos máquina"

1

El cofundador de Apple Steve Wozniak asegura que una de las cosas que más le preocupa es cómo construir software que resuelva las situaciones y actúe como lo haría un humano.

  • por Esther Paniagua | traducido por
  • 23 Agosto, 2012

Aunque las tecnologías de control por voz de dispositivos todavía están lejos de ser avanzadas, muy a nuestro pesar nos vemos obligados a usarlas en determinadas situaciones. La experiencia puede ser frustrante, incluso puede que no logremos nuestro propósito o que tengamos que repetir una y otra vez lo que queremos para que la máquina nos entienda. El control por voz es, hoy por hoy, uno de los grandes retos de la tecnología, que sigue siendo un interlocutor poco amigable para los humanos.

El futuro de estos sistemas es algo en lo que numerosas empresas con una visión prematura del negocio trabajan desde hace años. Es el caso de Nuance, producto de la adquisición de Dragon por parte de Scansoft para transformarse en una nueva compañía especializada en tecnología de reconocimiento de voz. Microsoft y Android están dedicando mucho dinero y recursos a la experimentación en este campo, y ahora también Apple. De igual modo, en el sector del motor compañías como Ford se están convirtiendo cada vez más en un negocio de servicios y menos de productos, y son conscientes de que el control por voz es un elemento clave para el conductor, que quiere controlar sus dispositivos sin apartar las manos del volante.

Representantes de algunas de estas empresas y de la consultora de servicios de voz y ‘comercio conversacional’ Opus Research se dieron cita esta semana en una conferencia organizada por el Club Churchill en Silicon Valley para debatir sobre ello. Si bien los participantes no se arriesgaron a hacer muchas predicciones, algo que quedó claro es que el desarrollo actual de estas tecnologías, pese a su evolución en los últimos años, sigue sin cumplir las expectativas. Llegar a conversar con un dispositivo como si de un amigo se tratara todavía sigue siendo un gran reto. Según Ron Kaplan, director sénior y distinguido científico de Nuance, “crear una ilusión de simplicidad es muy complejo”. “En una conversación cara a cara es más fácil entender lo que digo por cómo lo digo, pero lo difícil es cómo lograr que una interfaz conversacional haga eso”, señaló Kaplan.

Según el científico de Nuance, no es necesario que las máquinas entiendan el 100 por ciento de lo que decimos, pero sí “al menos un 80 por cien”. Además, evitar la ambigüedad de significados entendiendo el contexto del usuario es esencial para evitar malentendidos en la comunicación. En este sentido, el desafío tecnológico se encuentra, más que en la comunicación en sí, en la ejecución de esa comunicación, es decir, en cómo el aparato recibe, procesa, interpreta y responde al mensaje.

Steve Wozniak, cofundador de Apple, tiene claro que esta ejecución será cada vez más similar a la humana. En una intervención casi pasional, confesó que una de las cosas que más le preocupa es cómo construir software que resuelva las situaciones y actúe como lo haría un humano, aunque cree que “la interacción con nuestros dispositivos es cada día más humana y menos máquina”. Esto se debe, entre otras cosas, al desarrollo de aplicaciones que interpretan lo que el usuario quiere teniendo en cuenta determinada información de contexto - dónde está, qué hace, sus hábitos o qué hacen sus amigos- y toman la iniciativa antes incluso de que este se dé cuenta de que era eso lo que quería hacer. No obstante, la cantidad de datos que pueden manejar los dispositivos es todavía muy limitada e insuficiente para alcanzar la empatía que requiere una comunicación natural, “como si estuvieses hablando con tu mejor amigo”, pero el fundador de Apple no descarta que esto suceda algún día.

La directora de Tendencias Globales y Futuro de Ford, Sheryl Connely, también ofreció una perspectiva positiva, si bien reconoció que el desarrollo de tecnologías conversacionales “todavía está arañando la superficie”. “La tecnología es útil en tanto en cuanto es accesible, y el sistema de reconocimiento de voz permite que lo sea mucho más”, aseguró Connely. La hipótesis de Sheryl es que en estos tiempos en los que nos hemos vuelto tan dependientes de la información que algunos se refieren a ella como ‘oxígeno en línea’, el tiempo que esa información tarda en hacerse accesible a nosotros es crucial. “La activación por voz te permite hacerlo de forma más rápida, controlar el mundo a tu alrededor más fácilmente y actuar de forma más espontánea, ofreciéndote nuevas oportunidades”, aseguró durante el encuentro. “Realmente todo esto influye en tu grado de poder, de riqueza y de éxito, y por eso esta herramienta se está convirtiendo en algo verdaderamente esencial”, concluyó Sheryl, que cree además que esto “está cambiado los frentes en los que cada mercado compite, no solo marcando el desarrollo de nuevos productos sino transformando todo el negocio”.

Como consecuencia de esto y de las multimillonarias inversiones que las grandes compañías están haciendo en la experimentación con este tipo de tecnologías están surgiendo también nuevas oportunidades para start-ups para que vayan diseñando el paisaje futuro de la conversación entre humanos y máquinas. Tal vez en unos años estemos hablando no solo de reconocimiento de voz sino de todo un sistema integrado de comunicación mediante sonidos, gestos, señales, emociones y olores que traduzca nuestros pensamientos en acciones.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. La 'start-up' de EE UU que se enfrenta al gigante japonés de materiales para chips

    La financiación federal está impulsando a empresas estadounidenses como Thintronics a incursionar en la fabricación de semiconductores. El éxito está lejos de estar garantizado.

    Placas de circuitos electrónicos apiladas en una cadena de montaje.
  2. ASML, la empresa que revolucionó la fabricación de chips y quiere seguir haciéndolo

    ‘MIT Technology Review’ se reunió con el CTO saliente, Martin van den Brink, para hablar del ascenso de la empresa a la hegemonía y de la vida y muerte de la Ley de Moore  

    Dos trabajadores de ASML pasan por delante de la máquina UVE de alta apertura numérica en Veldhoven
  3. ‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU

    Al conectar varios chips menos avanzados en uno, las empresas chinas podrían eludir las sanciones impuestas por el gobierno estadounidense.