.

Richard Zhang

Richard Zhang

0

Adobe | Su sistema combina la computación con el juicio humano para superar a otros algoritmos de generación de imágenes.  

  • por Eileen Guo | traducido por
  • 12 Septiembre, 2023

Richard Zhang, (34 años) investigador científico senior de Adobe, inventó los algoritmos de similitud visual subyacentes a modelos de inteligencia artificial (IA) generadores de imágenes como Stable Diffusion y Stylegan.

Zhang empezó a explorar la IA generativa mientras completaba su doctorado en la UC Berkeley (California), donde creó un algoritmo muy utilizado para colorear fotos en blanco y negro. (Este trabajo se convirtió en la herramienta Colorear de Adobe Photoshop). 

Gracias este trabajo, Zhang se dio cuenta de que no había una "buena métrica objetiva" para entrenar el sistema de IA. "Es muy difícil escribir un mapa de lo que hace que una imagen le parezca buena a una persona", afirma, ya sean colores realistas o claridad de imagen.

La mayoría de los algoritmos utilizan modelos matemáticos para medir la similitud entre imágenes, pero la percepción humana es compleja y no se capta fácilmente con un problema matemático. Así que Zhang construyó algo mejor: LPIPS, su proyecto más influyente hasta la fecha.

LPIPS es único porque incorpora a sus cálculos grandes conjuntos de datos de juicios perceptivos humanos. Esto le ha permitido superar a todos los modelos anteriores, muchos de los cuales llevaban décadas en uso, y convertirse en el nuevo estándar de similitud perceptiva. Sin LPIPS, la actual IA de generación de imágenes no sería posible.

Desde que se unió a Adobe en 2018, la investigación de Zhang se ha incorporado a herramientas de software comerciales, incluidas las funciones de mezclador de paisajes y retrato inteligente de Photoshop. Zhang también ha trabajado en algoritmos que ayudan a las personas a detectar imágenes generadas por IA, que ahora forman parte de las herramientas forenses de Adobe Stock.