.

EMILIO MORENATTI/AP

Cadenas de bloques y aplicaciones

Translatotron, el nuevo traductor de Google que imita la voz y el tono

1

El sistema se compone de tres inteligencias artificiales capaces de traducir audios de español a inglés manteniendo el habla del emisor y reduciendo la tasa de error. Aunque de momento es una prueba de concepto, pronto podría convertirse en un producto comercial

  • por Karen Hao | traducido por Ana Milutinovic
  • 23 Mayo, 2019

Escuchen este audio en español.

Así es como suena su traducción al inglés por un sistema convencional de traducción automática.

Y ahora escuche cómo suena la misma traducción con el nuevo sistema de traducción automática de Google.

Los resultados no son perfectos, pero se nota cómo el traductor de Google es capaz de conservar la voz y el tono del orador original. Para lograrlo, el sistema convierte la entrada de audio directamente en la salida de audio sin ningún paso intermedio. A diferencia de él, los sistemas de traducción convencionales convierten el audio en texto, traducen el texto y luego resintetizan el audio, un proceso que hace que se pierdan las características de la voz original.

El nuevo sistema, denominado Translatotron, tiene tres componentes, y los tres analizan el espectrograma de audio del emisor, una instantánea visual de las frecuencias utilizadas cuando se reproduce el sonido, que se suele denominar huella de voz. El primer componente utiliza una red neuronal entrenada para mapear el espectrograma de audio en el idioma de entrada y recrear el espectrograma de audio en el idioma de salida. El segundo convierte el espectrograma en una onda de audio reproducible. Entonces, el tercer componente puede volver a poner las características vocales del orador original en la salida final de audio.

Este enfoque no solo produce traducciones más matizadas al conservar claves no verbales, sino que, en teoría, también debería minimizar los errores de traducción, ya que reduce los pasos necesarios para hacerlo.

En este momentom, Translatotron es una prueba de concepto. Durante los ensayos, los investigadores solo usaron el sistema para traducir del español al inglés, que ya tenía muchos datos de entrenamiento cuidadosamente seleccionados. Pero los resultados de audio como el de arriba demuestran el potencial de un futuro sistema comercial. Puede escuchar más ejemplos aquí.

Cadenas de bloques y aplicaciones

Qué significa estar constantemente contectados unos a otros y disponer de inmensas cantidades de información al instante.

  1. Las críticas obligan a Noruega a retirar su 'app' de rastreo de coronavirus

    Aunque Smittestopp tiene buenas características de privacidad, el organismo de protección de datos del país afirma que la baja tasa de contagios nacionales no justifica su uso. Los responsables del Instituto Noruego de Salud Pública no están de acuerdo y creen que la decisión limitará su capacidad de prevenir nuevos brotes

  2. Twitter intenta que la gente se lea los artículos antes de compartirlos

    Si un usuario va a retuitear un enlace sin haber pinchado en él, recibirá un mensaje animándolo a leerlo primero. La medida, lanzada de forma piloto en inglés y para teléfonos Android, supone un paso más en la cada vez más contundente postura de Twitter contra la viralización del odio y las noticias falsas

  3. Ocho cosas que Facebook debe hacer para mejorar la moderación de contenido

    Aunque se trata de una tarea imprescindible, la red social la ha externalizado en trabajadores precarios y sin la formación necesaria para soportar la traumática experiencia. Además, debería duplicar el número de moderadores y hacer que toda la empresa sea más consciente del impacto de sus decisiones