.

Inteligencia Artificial

La IA que no se agota: 'deepfakes' de 'influencers' chinos para retransmitir sin descanso

1

Con solo unos minutos de vídeo de muestra y 1.000 dólares (938 euros), las marcas nunca dejan de vender sus productos

  • por Zeyi Yang | traducido por
  • 22 Septiembre, 2023

Si a las 4 de la madrugada se desplaza por los vídeos en directo de Taobao, la plataforma de comercio electrónico más popular de China, verá que está extrañamente concurrida. Mientras la mayoría de personas duermen, muchos streamers diligentes continúan presentando productos ante las cámaras y ofrecen descuentos a altas horas de la madrugada.

Sin embargo, si uno se fija bien, se dará cuenta de que muchos de estos influencers parecen algo robóticos. El movimiento de sus labios coincide con lo que dicen, pero hay momentos en los que parece poco natural.

Estos streamers no son reales: son clones generados por IA de los verdaderos streamers. A medida que las tecnologías creadoras de avatares, voces y movimientos realistas se vuelven más sofisticadas y asequibles, la popularidad de estos deepfakes se ha disparado en las plataformas de streaming de comercio electrónico de China.

Hoy día, el livestreaming es el canal de marketing dominante para las marcas tradicionales y digitales en China. Las personas más influyentes de Taobao, Douyin, Kuaishou u otras plataformas pueden negociar grandes acuerdos en pocas horas. Los nombres más destacados pueden vender productos por valor de más de mil millones de dólares en una noche y adquirir el estatus de miembros de la realeza, como las grandes estrellas de cine. Pero, al mismo tiempo, formar a los presentadores de las retransmisiones en directo, retenerlos y resolver los detalles técnicos de la emisión supone un coste considerable para las marcas más pequeñas. Es más barato automatizar el trabajo.

Desde 2022, un enjambre de startups chinas y grandes empresas tecnológicas ofrecen el servicio de crear avatares deepfake para el livestreaming de comercio electrónico. Con solo unos minutos de vídeo de muestra y 1.000 dólares (938 euros), las marcas pueden clonar a un streamer humano para que trabaje 24 horas al día y 7 días a la semana.

Del deepfake al comercio electrónico

Los medios sintéticos han sido noticia desde finales de la década de 2010, en particular, cuando un usuario de Reddit llamado deepfake intercambió rostros en pornografía. Desde entonces, la tecnología ha evolucionado, pero la idea es la misma: con algunas herramientas técnicas, los rostros pueden generarse o manipularse para parecerse a humanos concretos y hacer cosas que estos humanos nunca ha hecho.

La tecnología ha sido conocida, sobre todo, por su uso problemático en la pornografía de venganza, las estafas de identidad y la desinformación política. Aunque hubo intentos de comercializarla de formas más inocuas, continuó siendo una novedad. Ahora, las empresas chinas de IA han encontrado un nuevo caso de uso que parece ir bien.

Silicon Intelligence, la start-up con sede en Nanjing y fundada en 2017, está especializada en el procesamiento del lenguaje natural (NLP, por sus siglas en inglés). En especial, en tecnologías de conversión de texto a voz, como las herramientas de robocall. Sima Huapeng, su fundador y CEO, afirma que la empresa empezó a ver el potencial de la IA como herramienta de retransmisión en directo en 2020.

Por entonces, Silicon Intelligence necesitaba 30 minutos de vídeos de entrenamiento para generar un clon digital que pudiera hablar y actuar como un humano. En 2021, el tiempo se redujo a 10 minutos, luego a tres y ahora solo se necesita un minuto de vídeo.

A medida que la tecnología mejora, el servicio también se ha abaratado. Ahora, generar un clon básico de IA cuesta unos 8.000 RMB (1.028 euros). Si el cliente quiere crear un streamer más complicado y capaz, el precio puede subir a varios miles de dólares. Además de la generación, esa tarifa también incluye un año de mantenimiento.


Vídeo de un transmisor de IA generado por Silicon Intelligence.

Una vez generado el avatar, su boca y su cuerpo se mueven al ritmo del audio guionizado. Aunque antes los guiones los preescribían humanos, ahora las empresas también utilizan grandes modelos lingüísticos para generarlos.

Ahora, lo único que tienen que hacer los trabajadores humanos es introducir información básica como el nombre y el precio del producto que se vende, corregir el guion generado y ver cómo el influencer emite en tiempo real. Una versión más avanzada de la tecnología puede detectar comentarios en directo y encontrar respuestas adecuadas en su base de datos para responder de manera inmediata, de modo que parezca que el streamer de IA se comunica con la audiencia. Incluso puede ajustar su estrategia de marketing en función del número de espectadores, explica Sima.

Estos clones de IA para retransmisiones en directo se entrenan con los guiones y gestos habituales de los vídeos de comercio electrónico, explica Huang Wei, director de Negocio de retransmisiones en directo con influencers en Xiaoice. Esta empresa china de IA cuenta con una base de datos de casi cien movimientos prediseñados.

"Por ejemplo, [cuando los locutores humanos dicen] 'Bienvenido a mi canal de streaming. Mueve los dedos y dale a follow", señalan con el dedo hacia arriba, porque ahí es donde está el botón de "Seguir" en la pantalla de la mayoría de las apps móviles de emisión", explica Huang. Del mismo modo, cuando los locutores presentan un nuevo producto, apuntan hacia abajo a la cesta de la compra, donde los espectadores pueden encontrar todos los productos. Los streamers con IA de Xiaoice reproducen estos trucos habituales. "Queremos asegurarnos de que el lenguaje hablado y el lenguaje corporal coinciden. No queremos que hable del botón de ‘Seguir’ mientras aplaude. Quedaría raro", dice.

Xiaoice, que se escindió del Microsoft Software Technology Center Asia en 2020, siempre se ha centrado en crear una IA más parecida a la humana, sobre todo avatares capaces de mostrar emociones. "Para la mayoría de los clientes, los sitios de comercio electrónico tradicionales son como una estantería de productos, son fríos. En el livestreaming, hay más conexión emocional entre el anfitrión y los espectadores, y pueden presentar mejor los productos", afirma Huang.

Tras una prueba piloto con algunos clientes en 2022, Xiaoice lanzó de manera oficial este año su servicio de generación de clones digitales de menos de 1.000 dólares. Como Silicon Intelligence, Xiaoice solo necesita streamers humanos que proporcionen un vídeo de sí mismos de un minuto de duración.

Al igual que sus competidores, los clientes de Xiaoice pueden gastar más para afinar los detalles. Por ejemplo, Liu Jianhong, un locutor deportivo chino, hizo un exquisito clon de sí mismo durante la Copa Mundial de la FIFA 2022 para leer los resultados de los partidos y otras noticias relevantes en Douyin.

Captura de pantalla de un vídeo mientras un anciano chino se sienta frente a la mesa.
El clon de IA de Liu Jianhong anunciando noticias sobre la Copa del Mundo.

Un sustituto barato para streamers humanos

Estos streamers generados por IA no podrán vencer a los influencers estrella del comercio electrónico, afirma Huang, pero son lo bastante buenos como para sustituir a los de nivel medio. Los creadores humanos, incluidos los que utilizaron sus vídeos para entrenar a sus clones de IA, ya sienten la presión de sus rivales digitales. En 2023, es más difícil conseguir trabajo como presentador de livestream de comercio electrónico, y el salario medio de los presentadores de livestream en China bajó un 20% en comparación con 2022, según iiMedai Research, la empresa de análisis .

Sin embargo, la posibilidad de que las empresas complementen el trabajo humano manteniendo la retransmisión en directo en las horas donde menos espectadores los ven hace difícil justificar el coste de contratar a auténticos streamers.

Ya está ocurriendo. En las horas posteriores a la medianoche, muchos de los canales de streaming de populares plataformas de comercio electrónico como Taobao y JD cuentan con estos streamers generados por IA.

Ejemplos anteriores han demostrado que las tecnologías deepfake no necesitan ser perfectas para engañar a los espectadores. En 2020, un estafador se hizo pasar por un famoso actor chino con la ayuda de burdas herramientas de intercambio de rostros y aun así consiguió obtener miles de dólares de mujeres desprevenidas que se enamoraron de sus vídeos.

"Si una empresa contrata a 10 presentadores de livestream, su nivel de conocimientos variará. Puede que dos o tres de ellos contribuyan al 70% u 80% de las ventas totales", afirma Chen Dan, CEO de Quantum Planet AI, una empresa que agrupa tecnologías como la de Xiaoice y las vende a clientes corporativos. "Un anfitrión virtual de livestream puede sustituir al resto: seis o siete streamers que contribuyen menos y tienen tasas de retorno de la inversión (ROI) más bajas. Y los costes se reducirían considerablemente".

Chen afirma que en 2023 las marcas han mostrado mayor interés por los streamers de IA, en parte, porque todo el mundo busca "reducir costes y mejorar la eficiencia". Esta palabra está de moda entre las empresas tecnológicas chinas a medida que la economía nacional se ralentiza.

Chen cuenta ya con más de 100 clientes que utilizan el servicio de Xiaoice, y estos streamers generados por IA han conseguido millones de dólares en ventas. Un streamer de Xiaoice consiguió más de 10.000 RMB (1.285 euros) en ingresos en tan solo una hora.


Si la transmisión en vivo se centra en un solo producto, el transmisor de IA de Xiaoice es capaz de interactuar con él frente a la cámara.

Aún hay inconvenientes, afirma Chen. Por ejemplo, muchos de sus clientes son marcas de muebles y, aunque la IA es lo bastante inteligente como para hablar y utilizar gestos, no puede sentarse en un sofá o tumbarse en una cama, por lo que las secuencias carecen del atractivo de los usuarios reales que prueban los productos.

Además de startups más pequeñas como Silicon Intelligence y Xiaoice, las grandes tecnológicas están probando retransmisiones en directo generadas por IA. Alibaba, Tencent, Baidu y JD lanzaron en 2023 algunas variaciones de los mismos servicios, permitiendo a las marcas de sus plataformas generar sus propios streamers de IA.

Las empresas de marketing que emplean a un gran número de streamers humanos también se han dado cuenta de esta tendencia. Foshan Yowant Technology, una de las principales agencias de marketing de livestream, ha anunciado una colaboración estratégica con Xiaoice. Silicon Intelligence también ha creado una empresa conjunta con la compañía que está detrás de Viya, la antigua reina del livestream en China.

La creciente popularidad de las retransmisiones en directo generadas por IA también ha llamado la atención de plataformas de vídeo como Douyin, la versión china de TikTok, aunque está adoptando un enfoque diferente al de otros gigantes tecnológicos. Parece más preocupada por la transparencia y, en un documento publicado en mayo de 2023, afirmó que todos los vídeos generados por IA deben etiquetarse como tales en la plataforma, y que los influencers virtuales deben ser operados por humanos reales. La plataforma siempre ha prohibido la publicación de vídeos grabados como falsos directos. Las retransmisiones en directo generadas por IA, sin imágenes grabadas, pero con escasa intervención humana en tiempo real, se sitúan en el límite de esta norma.

En los últimos dos años, el gobierno chino ha promulgado varias leyes sobre medios de difusión e IA generativa que se aplicarían al uso en el comercio electrónico vía streaming. Aún están por ver los efectos de las normativas gubernamentales y de las plataformas, porque la tecnología aún es demasiado nueva para que se haya encontrado con una aplicación seria.

Para Silicon Intelligence, su próximo paso es añadir "inteligencia emocional" a los streamers de IA, afirma Sima: "Si hay comentarios abusivos, se entristecerá. Si los productos se venden bien, se alegrará". La empresa también está trabajando para que los streamers de IA interactúen y aprendan unos de otros.

La empresa tiene un objetivo fascinante y algo aterrador desde sus inicios: quiere crear "100.000.000 de trabajadores basados en silicio" para 2025. Por ahora, la empresa ha generado 400.000 streamers virtuales, asegura Sima. Aún queda mucho camino por recorrer.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. La ley de la IA de la UE en cuatro claves

    El trabajo duro empieza ahora.

    Un candado azul con las estrellas amarillas de la UE de fondo
  2. La IA generativa puede convertir tus recuerdos en fotos que nunca existieron

    El proyecto Synthetic Memories ayuda a familias de todo el mundo a recuperar un pasado que nunca se fotografió

    Una imagen en blanco y negro generada por ai de una mujer y un niño mirando por una ventana
  3. "La pregunta es cuánta participación humana se necesita para que algo sea arte"

    Alex Reben hace arte con (y sobre) IA. Hablé con él sobre lo que la nueva ola de modelos generativos significa para el futuro de la creatividad humana

    Detalle de un cuadro de una cabeza deformada en la que unas enormes orejas en la parte frontal de la cara tapan los ojos y una lengua brillante con textura de fresa sobresale de la boca abierta.