.

EMILIO MORENATTI/AP

Cadenas de bloques y aplicaciones

Translatotron, el nuevo traductor de Google que imita la voz y el tono

1

El sistema se compone de tres inteligencias artificiales capaces de traducir audios de español a inglés manteniendo el habla del emisor y reduciendo la tasa de error. Aunque de momento es una prueba de concepto, pronto podría convertirse en un producto comercial

  • por Karen Hao | traducido por Ana Milutinovic
  • 23 Mayo, 2019

Escuchen este audio en español.

Así es como suena su traducción al inglés por un sistema convencional de traducción automática.

Y ahora escuche cómo suena la misma traducción con el nuevo sistema de traducción automática de Google.

Los resultados no son perfectos, pero se nota cómo el traductor de Google es capaz de conservar la voz y el tono del orador original. Para lograrlo, el sistema convierte la entrada de audio directamente en la salida de audio sin ningún paso intermedio. A diferencia de él, los sistemas de traducción convencionales convierten el audio en texto, traducen el texto y luego resintetizan el audio, un proceso que hace que se pierdan las características de la voz original.

El nuevo sistema, denominado Translatotron, tiene tres componentes, y los tres analizan el espectrograma de audio del emisor, una instantánea visual de las frecuencias utilizadas cuando se reproduce el sonido, que se suele denominar huella de voz. El primer componente utiliza una red neuronal entrenada para mapear el espectrograma de audio en el idioma de entrada y recrear el espectrograma de audio en el idioma de salida. El segundo convierte el espectrograma en una onda de audio reproducible. Entonces, el tercer componente puede volver a poner las características vocales del orador original en la salida final de audio.

Este enfoque no solo produce traducciones más matizadas al conservar claves no verbales, sino que, en teoría, también debería minimizar los errores de traducción, ya que reduce los pasos necesarios para hacerlo.

En este momentom, Translatotron es una prueba de concepto. Durante los ensayos, los investigadores solo usaron el sistema para traducir del español al inglés, que ya tenía muchos datos de entrenamiento cuidadosamente seleccionados. Pero los resultados de audio como el de arriba demuestran el potencial de un futuro sistema comercial. Puede escuchar más ejemplos aquí.

Cadenas de bloques y aplicaciones

Qué significa estar constantemente contectados unos a otros y disponer de inmensas cantidades de información al instante.

  1. Ciberguerra, 'ransomware' y robo de criptodivisas: la claves en ciberseguridad para 2023

    "Cuando se trata de eliminar el 'ransomware' desde la fuente, creo que dimos un paso atrás", asegura un experto

  2. Descentralización contra regulación: el debate de las criptomonedas en 2023

    Este año habrá una lucha por el alma de las finanzas descentralizadas

  3. Ethereum abandona la criptominería y adopta la prueba de participación

    Nadie sabe exactamente qué le depara a la industria de las criptomonedas tras esta esperada actualización