.

EMILIO MORENATTI/AP

Móvil

Translatotron, el nuevo traductor de Google que imita la voz y el tono

1

El sistema se compone de tres inteligencias artificiales capaces de traducir audios de español a inglés manteniendo el habla del emisor y reduciendo la tasa de error. Aunque de momento es una prueba de concepto, pronto podría convertirse en un producto comercial

  • por Karen Hao | traducido por Ana Milutinovic
  • 23 Mayo, 2019

Escuchen este audio en español.

Así es como suena su traducción al inglés por un sistema convencional de traducción automática.

Y ahora escuche cómo suena la misma traducción con el nuevo sistema de traducción automática de Google.

Los resultados no son perfectos, pero se nota cómo el traductor de Google es capaz de conservar la voz y el tono del orador original. Para lograrlo, el sistema convierte la entrada de audio directamente en la salida de audio sin ningún paso intermedio. A diferencia de él, los sistemas de traducción convencionales convierten el audio en texto, traducen el texto y luego resintetizan el audio, un proceso que hace que se pierdan las características de la voz original.

El nuevo sistema, denominado Translatotron, tiene tres componentes, y los tres analizan el espectrograma de audio del emisor, una instantánea visual de las frecuencias utilizadas cuando se reproduce el sonido, que se suele denominar huella de voz. El primer componente utiliza una red neuronal entrenada para mapear el espectrograma de audio en el idioma de entrada y recrear el espectrograma de audio en el idioma de salida. El segundo convierte el espectrograma en una onda de audio reproducible. Entonces, el tercer componente puede volver a poner las características vocales del orador original en la salida final de audio.

Este enfoque no solo produce traducciones más matizadas al conservar claves no verbales, sino que, en teoría, también debería minimizar los errores de traducción, ya que reduce los pasos necesarios para hacerlo.

En este momentom, Translatotron es una prueba de concepto. Durante los ensayos, los investigadores solo usaron el sistema para traducir del español al inglés, que ya tenía muchos datos de entrenamiento cuidadosamente seleccionados. Pero los resultados de audio como el de arriba demuestran el potencial de un futuro sistema comercial. Puede escuchar más ejemplos aquí.

Móvil

Qué significa estar constantemente contectados unos a otros y disponer de inmensas cantidades de información al instante.

  1. Barcelona revoluciona la navegación para invidentes con estas pegatinas

    Gracias a estos cuadrados de colores, las personas con discapacidad visual ahora pueden usar el transporte público de la urbe española con mucha más facilidad. El sistema, desarrollado por la Universidad de Alicante, destaca por usar códigos QR en lugar de GPS que no sirve en interiores

  2. Dai, la 'stablecoin' amada por todos no es tan estable como prometía

    Su estrategia para mantenerse estable frente al dólar estadounidense todavía no ofrece suficientes garantías. Además, la "criptoemperatriz" de la Comisión de Bolsa y Valores de EE. UU., Valerie Szczepanik, afirma que esta criptomoneda tal vez debería ser regulada como un valor

  3. Por qué Facebook lleva razón al no borrar el vídeo manipulado de Pelosi

    No se trata de un 'deepfake' en el que la política aparezca diciendo algo que no ha dicho, sino de una sátira. Si la red social lo elimina, podría sentar un peligroso precedente en torno a la censura. Los expertos afirman que la mejor estrategia contra la desinformación es la alfabetización mediática