Computación

Las 'apps' del futuro controlarán tu día a día a través de tus fotos

Un algoritmo reconoce las actividades cotidianas tomadas por la cámara desde un punto de vista egocéntrico con un 83% de acierto

por Graham Templeton | traducido por Teresa Woods
26 Octubre, 2015

Nuevas investigaciones sobre redes neuronales podrían permitir a los ordenadores identificar nuestra actividad cotidiana con mayor precisión que las apps que rastrean cosas como la ubicación por GPS y el ritmo cardíaco del usuario. Un nuevo modelo de ordenador ha logrado identificar, con una precisión de aproximadamente el 83%, las actividades que observa en imágenes de la vida real. Con un poco de entrenamiento podría hacerlo con cualquier usuario con el que se encuentre.

Liderados por los estudiantes de postgrado del Instituto de Tecnología de Georgia (EEUU) Daniel Castro y Steven Hickson, los investigadores han creado una red neuronal artificial diseñada para identificar las escenas de las llamadas fotografías "egocéntricas" sacadas desde la perspectiva del usuario. Normalmente provienen de cámaras portables como Narrative Clip, MeCam, Google Glass y GoPro, pero las fotos de móvil a menudo sirven también.

El equipo dotó a la red de sus capacidades al entrenarla con un conjunto de unas 40.000 imágenes sacadas por un individuo durante un período de seis meses. Este voluntario asoció manualmente cada foto con una actividad, y de forma natural se decidió por el uso de 19 etiquetas de actividades básicas, que incluyen conducir, ver la tele, tiempo familiar y la higiene.

Un algoritmo de aprendizaje combina las suposiciones de la red con los metadatos acerca del día y la hora en los que se captó la imagen. Esto permite que la red aprenda las asociaciones comunes entre actividades e incluso que haga predicciones acerca de las futuras actividades del usuario.

"Es un método en conjunto, donde entrenamos más allá que a través de un aprendizaje profundo simple", explica Hickson. "Así se puede aprovechar el aprendizaje profundo, y la información contextual básica de las actividades básicas" (ver Aprendizaje profundo).

Los desarrolladores de las tecnologías portables podrían ofrecer unos servicios mucho más intuitivos con esta tecnología. Los investigadores imaginan una app que identifique los hábitos alimenticios o de ejercicio y sugiera posibles mejoras. Y puesto que puede aprenderse tus horarios, podría hacer sugerencias inteligentes sobre la marcha, como salir de casa pronto para dirigirse al trabajo a consecuencia de un informe de tráfico. Castro dice que incluso podría permitir que una app reorganice las actividades dentro de un día determinado para se puedan completar de una forma más eficiente.

El investigador de Microsoft Gordon Bell ha trabajado en la llamada "e-memoria", que tiene por objetivo fomentar la memoria humana con ordenadores. Dice que la clave es que las máquinas sean capaces de reconocer el contenido de las fotos. "Cada uno de estos avances [en aprendizaje de máquinas] es increíblemente valioso", dice Bell. "Yo vería [esta capacidad de indexación] como algo que aumentará tus capacidades de memoria a largo plazo al ser capaz de encontrar cosas en situaciones anteriores". Asegura que en el futuro, los algoritmos de e-memoria podrían buscar dentro de una amplia variedad de fotos sacadas no sólo desde una perspectiva egocéntrica, "por lo que tiene un amplio abanico de aplicabilidad".

Por suerte, no todos los usuarios tienen que compilar una base de datos de 40.000 imágenes para aprovecharse de esta tecnología. Cuando el equipo probó su conjunto de aprendizaje de máquinas con dos voluntarios nuevos, el sistema luchó contra el cambio de estilo de vida. Hickson dice que hicieron "un estudio rápido" del efecto de ajustar el modelo, entrenándolo con las fotos egocéntricas de un sólo día de cada uno de los dos voluntarios nuevos. La precisión de los resultados aumentó dramáticamente, dice.

Pero las cámaras portables suelen asociarse a problemas de privacidad y confianza del usuario. La fotografía de punto-de-vista permite un nivel de perspicacia que puede resultar extremadamente útil cuando se pone a trabajar para los usuarios, pero también podría crear un blanco muy goloso para los hackers malintencionados y las entrometidas empresas de publicidad. La práctica incluso se está volviendo política mediante el uso en auge de cámaras corporales de la policía para grabar automáticamente las interacciones con sospechosos.

Alguno de estos problemas podría desaparecer si el hardware requerido para ejecutar intensivos algoritmos de aprendizaje de máquinas en los dispositivos móviles de consumo se vuelve disponible. Si los datos no tuviesen que desplazarse por internet para ser procesados, dicen los investigadores, la seguridad se volvería mucho más fácil de gestionar. Castro dice que el reto consiste en "establecer ya cuáles son los retos de privacidad para que no nos encontremos con estos problemas después, digamos dentro de cinco años, cuando estos dispositivos estén ampliamente disponibles".

Los investigadores sí evalúan la posibilidad de un algoritmo de análisis de imágenes que pudiera complementar el suyo al identificar y extraer informaciones privadas de las imágenes de forma automática – una petición informal de la comunidad del aprendizaje de máquinas que hace tan sólo un par de años habría parecido demasiado ambiciosa.

Computación

Las 'apps' del futuro controlarán tu día a día a través de tus fotos

La 'start-up' de EE UU que se enfrenta al gigante japonés de materiales para chips

ASML, la empresa que revolucionó la fabricación de chips y quiere seguir haciéndolo

‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU