.

Computación

El reconocimiento facial: ingenioso o espeluznante

1

Los nuevos programas de fotos de Apple y Google incluyen una tecnología revolucionaria para detectar rostros.

  • por Simson Garfinkel And Beth Rosenberg | traducido por Rubén Oscar Diéguez
  • 02 Marzo, 2009

Tenemos más de 25.000 fotografías digitales almacenadas en los discos duros y la mayoría de ellas son de personas. Hasta ahora, nuestro único medio para rastrear una cara familiar era realizando una búsqueda manual; por fecha, por datos EXIF, etiquetas, o la fuerza bruta de tu propia memoria. Ahora, los ordenadores pueden realizar la búsqueda mediante una herramienta ingeniosa de reconocimiento de rostros que Apple y Google incorporaron a sus últimas versiones de sistemas de administración de fotos.

El reconocimiento de rostros fue una de aquellas tecnologías brillantes, pero técnicamente dudosas y éticamente delicadas de antiterrorismo que se utilizaron a raíz de los ataques del 11 de septiembre. La idea era detectar a los terroristas automáticamente a medida que atravesaban puntos de cotejo de seguridad, sólo que no funcionó de ese modo. Por ejemplo, en una prueba en Tampa, los empleados del aeropuerto fueron identificados correctamente sólo el 53% de las veces. Los grupos de derechos civiles también plantearon problemas respecto de los falsos positivos, (personas identificadas y posiblemente arrestadas sólo por su apariencia). Y así, sin un beneficio demostrable, el reconocimiento de rostros básicamente desapareció de la atención pública.

Reiteramos, de la atención pública. Muchos países, incluso Estados Unidos, modifican sus requisitos para fotografías de pasaporte para que sean más afines al software de reconocimiento de rostros. El National Institute of Standard and Technology estadounidense, que levaba probando la tecnología desde 1994, realizó pruebas de reconocimiento de rostros a gran escala en 2002 y 2006. Oregon y otros estados comenzaron a utilizar reconocimiento de rostros para detectar cuándo una persona quiere obtener una licencia para conducir usando distintos nombres. Y a medida que pasaba el tiempo, la tecnología iba mejorando considerablemente.

A fin de conseguir un sistema de reconocimiento facial que funcione, el ordenador tiene que detectar primero una cara, es decir que en una fotografía deberá poder hallar las caras que contiene. Técnicamente, esto es más fácil y mucho más fiable que identificar a una persona en particular. Esta tecnología se perfeccionó mucho después del 11 de septiembre de 2001. El resultado fue que sistemas de detección de rostros comenzaron a aparecer en cámaras digitales hace pocos años. Estos algoritmos generalmente funcionan buscando objetos que se parecen a ojos, una nariz y tal vez algo que sea como redondo. Identifican cuadrados en los que es probable que haya caras y luego le indican al foco automático los lugares en que la foto necesita estar en foco. Después de todo, todo el mundo odia cuando los ojos de la abuela salen borrosos, ¿no?.

Así que el reconocimiento de rostros comienza con la detección de caras. Luego la cara se rota para que los ojos estén nivelados y se les aplica una escala para lograr un tamaño uniforme. Después entra en juego uno de tres métodos técnicos diferentes. Cada uno tiene sus propias patentes y está incorporado a varios artículos que están a la venta. Un método transforma al rostro en una plantilla matemática que puede almacenarse y a la que se puede acceder; el segundo utiliza toda la cara como plantilla y realiza coincidencias de imagen y el tercero intenta crear un modelo 3-D basado en la cara, y luego realiza algún tipo de coincidencia geométrica. Basándonos en nuestra experiencia con el software, creemos que Apple está utilizando el sistema de los rasgos mientras que el sistema de Google está aplicando algún tipo de coincidencia de imágenes. Pero podríamos estar equivocados ya que ninguna empresa publicó el tipo de algoritmos que está utilizando.

Probamos el reconocimiento de caras del iPhoto ’09 de Apple aplicándolo a dos bases de datos diferentes con 17.000 y 10.000 fotografías almacenadas en nuestros propios discos duros. El Picasa de Google sólo trabaja con álbumes de la red ya cargados; lo probamos con alrededor de 500 fotos que había. El veredicto: ambos sistemas funcionan bastante bien, son extremadamente 'guay' pero también un tanto espeluznantes.

Ciertamente que iPhoto es el más fácil de usar. La primera vez que lo ejecutas, busca todas las caras de tu biblioteca de fotos; esto tardó alrededor de cuatro horas en una iMac dual-core. Luego, cliqueas en la foto de alguien que conoces; cliqueas “Nombre” y rellenas la caja de texto debajo de la cara del sujeto. iPhoto recorrerá tu biblioteca de fotos buscando otras fotos de la misma persona. (El reconocimiento parece basarse en los rasgos dentro de una caja de reconocimiento limitada por ambas sienes, las cejas y el mentón).

En general, iPhoto hace un trabajo sorprendentemente bueno al hallar un grupo de fotos de la persona elegida y “nombrada”. Pero en el proceso, también encuentra fotos de otras personas. Así que tu próxima tarea es indicarle a iPhoto qué fotos están bien y cuáles mal. no ninguna, puedes elegir una de forma manual y darle un punto de partida nuevo a iPhoto; así buscará más. También puedes cliquear en una foto y pedirle a iPhoto que trate de definir quién está en ella; si confirmas la elección de iPhoto, el modelo mejora aún más.Nos asombró la capacidad de iPhoto para hallar fotos de nuestros hijos. Fue increíble que distinguiera entre nuestros gemelos idénticos. (La clave radica en que uno de ellos tiene un rostro más delgado y largo que el otro). Sin embargo, nos decepcionó que encontrásemos más fotos de un gemelo que del otro, aunque les habíamos fotografiado las mismas veces y a menudo usando la misma toma. Un estudio de sus fotos reveló algo que no habíamos notadospero que iPhoto sí: uno de los gemelos siempre mira directamente a la cámara pero el otro tiende a torcer la cara, alejándose, y el programa de reconocimiento de caras de iPhoto no funciona si detecta un solo ojo. También tenemos muchas fotos de chicos con las caras pintadas. iPhotno no detectó casi ninguna de esas, excepto cuando la pintura se limitaba a la mitad de la frente del chico (lo que queda fuera de su cuadrado de reconocimiento).

Es tentador tratar de descifrar el sistema de reconocimiento de iPhoto. Al buscar fotos de Beth surgieron muchas fotos de la ex novia de Simson. Es tentador decir que es porque iPhoto sabe lo que le gusta a Simson, pero esto también podría ser un prejuicio en el corpus de nuestra prueba: si eliges varias fotos de la biblioteca de Simson, probablemente te encuentres con varias de sus ex novias. iPhoto también hizo un trabajo sorprendentemente bueno al hallar fotos de nuestros gatos, especialmente los de piel blanca o anaranjada. Lamentablemente, no identificó a los gatitos; suponemos que es porque es más difícil distinguir rasgos faciales cuando los ojos tienen el mismo color que las mejillas. E iPhoto realiza un trabajo apabullante cuando halla y reconoce caras en las sombras o en situaciones de poco contraste. Eso se debe a que mejora el contraste entre el rostro y el fondo, supuestamente para resaltar los rasgos.

Desde que instalamos iPhoto ’09 nuestra familia se pasa horas sentada en torno al ordenador, buscando fotos de los chicos y enseñándole al ordenador cómo es cada uno. Hallamos un montón de fotos viejas de las cuales nos habíamos olvidado. Nos reímos cuando hay errores en las coincidencias. Tratamos de entender los algoritmos. Este es uno de los programas más interesantes que jamás haya creado Apple.La tecnología de Picasa de Google es mucho más espeluznante. En vez de comenzar con la foto de alguien que conoces y buscar todas las coincidencias similares, Google lleva cada foto cargada a Picasa, busca todas las caras que aparecen en ellas y las va “reuniendo” en grupos de, supuestamente, cada persona diferente. Luego analizas cada grupo y le indicas a Google quién es la persona, incluso su nombre completo, apodo y dirección de correo electrónico.De hecho, los “grupos” que forma Google no son tan buenos. Frecuentemente mete a distintas personas en el mismo grupo, y crea grupos diferentes de una misma persona. Y a diferencia de iPhoto, que podía hacer coincidir fotos de nuestra hija de 12 años con las fotos de cuando gateaba, Google entendió que las imágenes eran de chicos diferentes. Pero la interfaz de usuario de Google es bastante fácil de usar, la tarea de buscar coincidencias es bastante convincente y antes de darte cuenta todas tus fotos estarán identificadas con todos los nombres reales y direcciones de correo electrónico de cada persona que aparece en las fotos.

Esta identificación con nombres reales es lo que hace que el reconocimiento facial de Google sea tan espeluznante. Recuerda que todas estas fotos no están en tu ordenador, están en el servidor de Google. Y debido a que los correos electrónicos son únicos, Google podría utilizar las fotos identificadas aportadas por todos sus usuarios de Picasa para crear una base de datos global donde se indican los correos electrónicos de quienes aparecen en las fotos. Hacerlo ni siquiera violaría la política de privacidad de Google, mientras que Google sólo utilice esta información para que el servicio “mejore” y que no haga que la base de datos sea de acceso público.Pero lo que es realmente inquietante de este servicio es que no se detiene con tus amigos que aparecen. De repente Google te está pidiendo que identifiques todas las caras que aparecen en tus fotografías, las personas que aparecen al fondo, caras en una muchedumbre e incluso caras en los póster. Esto encaja, ciertamente, con la misión colectiva de Google de “organizar la información del mundo y hacer que sea universalmente accesible y útil”. Pero ¿eso es lo que realmente queremos de una página para compartir fotos?

Nuestras experiencias con iPhoto fueron un placer; nos entusiasmó y complació hallar tantas fotos de nuestros hijos, familia y amigos (hasta de nosotros mismos). Por otro lado, cuando utilizamos la herramienta de identificación avanzada en Picasa de Google, nos sentíamos como si fuéramos analista de inteligencia trabajando en un laboratorio subterráneo de algún gobierno totalitario.

Creemos que la tecnología de reconocimiento facial dirigida al público alterará en forma fundamental los debates de política pública respecto de biométrica y vigilancia de vídeo masiva. Después del 11 de septiembre, nadie entendió realmente cómo funcionaba esta tecnología, lo que funcionaba bien y lo que no. Pero antes de finales de este año, millones de estadounidenses tendrán experiencias de primera mano con algunos de los mejores sistemas de reconocimientos de cara jamás utilizados. Una vez que la novedad de las fotos familiares se desvanezca, estaremos a la expectativa de si los usuarios de Picasa o iPhoto le piden a su gobierno que regule esta tecnología o que acelere su uso.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. ASML, la empresa que revolucionó la fabricación de chips y quiere seguir haciéndolo

    ‘MIT Technology Review’ se reunió con el CTO saliente, Martin van den Brink, para hablar del ascenso de la empresa a la hegemonía y de la vida y muerte de la Ley de Moore  

    Dos trabajadores de ASML pasan por delante de la máquina UVE de alta apertura numérica en Veldhoven
  2. ‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU

    Al conectar varios chips menos avanzados en uno, las empresas chinas podrían eludir las sanciones impuestas por el gobierno estadounidense.

  3. Esta ciudad china quiere ser el Silicon Valley de los ‘chiplets’

    Wuxi, el centro chino del envasado de chips, está invirtiendo en la investigación de ‘chiplets’ para potenciar su papel en la industria de semiconductores