.

Computación

La información demográfica del futuro: lo que la IA cree que su coche dice de usted

1

Los conductores de berlinas suelen votar a demócratas y los de camionetas a republicanos, según un análisis de los vehículos que aparecen en las imágenes de Google Street View

  • por Emerging Technology From The Arxiv | traducido por Teresa Woods
  • 14 Marzo, 2017

Cada año, la Oficina del Censo de Estados Unidos destina 1.000 millones de dólares (unos 951 millones de euros) a encuestas de población. Estas encuestas están diseñadas para desentrañar la composición demográfica del país. Para ello, un grupo representativo de personas responde a preguntas sobre su raza, género, educación, ocupación y así sucesivamente. Se trata de una labor importante, ya que ofrece una vista aérea crucial de la población y de cómo está cambiando. 

Pero no es fácil. Para empezar, los datos tienen una escala relativamente grande. Por ejemplo, la principal encuesta que realiza es la Encuesta de la Comunidad Estadounidense, que proporciona resultados de todas las ciudades y los condados con una población superior a 65.000 habitantes. Las zonas más pequeñas no figuran.

Además, encuestar a la población requiere mucho tiempo; tanto que algunos datos tardan hasta cinco años en publicarse. Y puesto que otros son más nuevos, las comparaciones pueden resultar problemáticas.

Así que a los demógrafos les encantaría disponer de una manera más rápida, eficiente y precisa de estudiar la población.

Aquí es donde entra en escena el investigador de la Universidad de Stanford (EEUU) Timnit Gebru y sus compañeros, que han empleado imágenes de Google Street View para realizar evaluaciones demográficas increíblemente precisas de un amplio abanico de ciudades estadounidenses. Su técnica presenta una vía totalmente nueva para que los demógrafos obtengan datos fiables que complementa y mejora los métodos actuales.

El equipo de Gebru empezó con 50 millones de imágenes de Street View recopiladas por los coches de Google en 200 ciudades estadounidenses. El equipo cree que el tipo de vehículo que la gente posee representa un fuerte indicador de su raza, ingresos, educación, ocupación y otros parámetros.

Así que Gebru entrenó un conjunto de algoritmos de visión automática para que reconocieran coches dentro de estas imágenes y después los clasificaran entre 2.657 categorías distintas que dependen no sólo de la marca y modelo del coche, sino también de su antigüedad. Esto proporciona una idea precisa del valor del coche.

En total, clasificaron unos 22 millones de vehículos, alrededor de un tercio de todos los que circulan por las carreteras de estas ciudades. La máquina tardó cerca de dos semanas en ejecutar la tarea a un ritmo de unos 0,2 segundos por vehículo. "A una velocidad de 10 segundos por imagen, un humano tardaría 15 años en hacer la misma tarea", señala el equipo de Gebru.

Pero, ¿cómo se relaciona la información de los vehículos con la demografía de una zona? Para averiguarlo, el equipo entrenó otro algoritmo de aprendizaje profundo para aprender la correlación entre los tipos de vehículo, los datos del censo estadounidense y los patrones de votación en elecciones presidenciales en cada distrito (una zona de alrededor de 1.000 personas). Este conjunto de datos de entrenamiento incluyó los datos de 35 ciudades.

Después emplearon el resto de los datos para probar el algoritmo de aprendizaje profundo. La pregunta que querían contestar era: dado el patrón de vehículos en una zona, ¿podría el algoritmo predecir con precisión la demografía registrada por el censo estadounidense y los datos de votación presidenciales?

Resulta que el algoritmo de aprendizaje profundo lo hace increíblemente bien. "La clasificación de vehículos de cada barrio revela un amplio conjunto de estadísticas demográficas, atributos socioeconómicos y preferencias políticas de sus residentes", afirman.

Por ejemplo, las berlinas están fuertemente asociadas a demócratas, mientras que las camionetas de cabina extendida están más vinculadas con los distritos republicanos. El equipo señala: "Conducir por una ciudad durante 15 minutos mientras contábamos berlinas y camionetas nos permitió determinar de manera fiable si una ciudad vota a demócratas o republicanos".

Una importante pregunta es si estas conclusiones concuerdan con las que han sido recopiladas por otras encuestas convencionales. Para averiguarlo, el equipo de Gebru comparó sus resultados con los datos de la propia Oficina del Censo Estadounidense de la Encuesta de la Comunidad Estadounidense. Y descubrieron que su información estaba fuertemente correlacionada con factores demográficos como los ingresos, la educación, la ocupación y así sucesivamente. Hasta pudieron realizar detalladas predicciones sobre las preferencias de los votantes a nivel de distrito, que incluye a unas 1.000 personas.

La Encuesta de la Comunidad Estadounidense probablemente seguirá siendo el estándar de oro para la recopilación de datos, al menos de momento. Pero la capacidad de recopilar información de alta calidad rápidamente mediante Google Street View podría monitorizar en tiempo real los cambios dentro de la población.

Y, por supuesto, Google no es la única organización que recopila imágenes de las calles. Este proceso podría ser fácilmente aplicado a imágenes de Facebook, Twitter u otras redes sociales que geolocalizadas y fechadas.

Ref: arxiv.org/abs/1702.06683: Using Deep Learning and Google Street View to Estimate the Demographic Makeup of the US

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. ‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU

    Al conectar varios chips menos avanzados en uno, las empresas chinas podrían eludir las sanciones impuestas por el gobierno estadounidense.

  2. Esta ciudad china quiere ser el Silicon Valley de los ‘chiplets’

    Wuxi, el centro chino del envasado de chips, está invirtiendo en la investigación de ‘chiplets’ para potenciar su papel en la industria de semiconductores

  3. La computación cuántica se abre camino a través del ruido

    Durante un tiempo, los investigadores pensaron que tendrían que conformarse con sistemas ruidosos y propensos a errores, al menos a corto plazo. Esto está empezando a cambiar.

    Jay Gambetta dirige el desarrollo de los ordenadores cuánticos de IBM y lideró la iniciativa de llevar estos sistemas a la nube.