.

Tecnología y Sociedad

Fractales para que la IA a 'vea' con más claridad y neutralidad

1

Grandes conjuntos de datos como ImageNet han sobrealimentado los últimos 10 años de la visión de la IA, pero son difíciles de producir y suelen estar sesgados. Usar imágenes de este tipo, pero generadas automáticamente reduce el tiempo de entrenamiento y los posibles sesgos de las imágenes sacadas de internet

  • por Will Douglas Heaven | traducido por Ana Milutinovic
  • 12 Febrero, 2021

La mayoría de los sistemas de reconocimiento de imágenes se entrenan mediante grandes bases de datos que contienen millones de fotos de objetos cotidianos, desde serpientes hasta batidos y zapatos. Mediante la exposición repetida, los modelos de inteligencia artificial (IA) aprenden a distinguir un tipo de objeto de otro.

Ahora, investigadores de Japón han demostrado que la IA puede aprender a reconocer los objetos cotidianos después de ser "entrenada" mediante fractales generados por ordenadorEs una idea extraña, pero podría ser importante. Generar datos de entrenamiento de forma automática es una tendencia interesante del aprendizaje automático. Y el uso de un suministro interminable de imágenes sintéticas frente a las fotos sacadas de internet evita los problemas de los conjuntos de datos existentes creados manualmente.

Problemas de entrenamiento: el entrenamiento previo es la fase en la que una IA aprende algunas habilidades básicas antes de ser entrenada con otros datos más especializados. Los modelos previamente entrenados permiten que más personas utilicen una IA potente. En vez de tener que entrenar un modelo desde cero, pueden adaptar a sus necesidades un modelo ya existente. Por ejemplo, un sistema para diagnosticar exploraciones médicas podría aprender primero a identificar algunas características visuales básicas, como la forma y el contorno, al ser previamente entrenado en una base de datos de objetos cotidianos, como ImageNet, que contiene más de 14 millones de fotos. Luego, se adaptará a una base de datos más pequeña de imágenes médicas para que aprenda a reconocer signos sutiles de enfermedad.

El problema consiste en que la creación manual de un conjunto de datos como ImageNet requiere mucho tiempo y esfuerzo. Las imágenes las suelen etiquetar los trabajadores colaborativos cuyos salarios son muy bajos. Los conjuntos de datos también pueden contener etiquetas sexistas o racistas que sesgan un modelo de manera oculta, así como imágenes de personas que han sido incluidas sin su consentimiento. Hay evidencia de que estos sesgos pueden infiltrarse incluso en el entrenamiento previo.

Formas naturales: se pueden encontrar patrones fractales en todo, desde los árboles y las flores hasta nubes y olas. Por eso, el equipo del Instituto Nacional de Ciencia y Tecnología Industrial Avanzada (AIST) de Japón, el Instituto de Tecnología de Tokio y la Universidad Denki de Tokio (todos en Japón) quiso investigar si estos patrones se podrían usar para enseñar a un sistema automatizado los conceptos básicos del reconocimiento de imágenes, en vez de usar fotos de objetos reales.

Los investigadores crearon FractalDB, un sinfín de fractales generados por ordenador. Algunos se parecen a hojas; otros a copos de nieve o caracoles. Cada grupo de patrones similares recibió automáticamente una etiqueta. Luego usaron FractalDB para el entrenamiento previo de una red neuronal convolucional (un tipo de modelo de aprendizaje profundo comúnmente utilizado en los sistemas de reconocimiento de imágenes) antes de completar su entrenamiento con un conjunto de imágenes reales. Descubrieron que su enfoque funcionaba casi tan bien como los modelos entrenados en los conjuntos de datos de última generación, incluidos ImageNet y Places, que contiene 2,5 millones de imágenes de escenas al aire libre. 

¿Funciona?  El investigador de la Universidad de Auburn en Alabama (EE. UU.) Anh Nguyen, que no participó en el estudio, no está convencido de que FractalDB sea tan compatible con ImageNet. Nguyen ha estudiado cómo los patrones abstractos pueden confundir los sistemas de reconocimiento de imágenes. "Existe una conexión entre este trabajo y los ejemplos que engañan a las máquinas", asegura. Nguyen quiere explorar con más detalle cómo funciona este nuevo método. Pero los investigadores japoneses piensan que al ajustar su enfoque, los conjuntos de datos generados por ordenador como FractalDB podrían sustituir los existentes.  

Por qué fractales: los investigadores también intentaron entrenar su IA utilizando otras imágenes abstractas, incluidas las generadas mediante la función matemática Ruido Perlin, que crea patrones moteados, y mediante curvas de Bezier, que se usan en el diseño gráfico. Pero los fractales dieron los mejores resultados. "La geometría fractal existe en el conocimiento básico del mundo", concluye el autor principal Hirokatsu Kataoka del AIST.

Tecnología y Sociedad

Los avances tecnológicos están cambiando la economía y proporcionando nuevas oportunidades en muchas industrias.

  1. La demanda que podría lograr el fin del reconocimiento facial policial

    Robert Williams fue arrestado injustamente debido al mal funcionamiento de la tecnología, cuyo impacto negativo es desproporcionadamente más alto en personas negras. Aunque esto ya se sabía, muchos departamentos de Policía siguen usándola y negándose a ver la discriminación que genera

  2. Ha llegado la hora de crear un internet feminista. Será mejor para todos

    La experiencia 'online' de las mujeres está llena de odio, acoso, violencia y sexualización, y la culpa es del diseño de las plataformas, redes y algoritmos y de los 'clubes de chicos' de las 'Big Tech' que los manejan. Reinventar internet para cuidar a mujeres y niñas nos beneficiará a todos, y ya es hora de hacerlo

  3. "La IA acorta tiempo, pero necesitas brillantez humana para ir más allá"

    La tecnología, la innovación abierta y colaboración pública y privada son esenciales para el avance del sector farmacéutico, afirma el HR Business Partner Recursos Humanos de Sanofi David Reyero, que también resalta la importancia de sumar fuerza e inteligencia entre distintos profesionales y herramientas tecnológicas