.

Inteligencia Artificial

La 'start-up' de IA que preserva los idiomas de África: "Somos custodios de nuestras lenguas"

1

Los modelos de IA no entienden las lenguas africanas, y Lelapa AI intenta revertir esta situación

  • por Abdullahi Tsanni | traducido por
  • 27 Noviembre, 2023

En un co-working del barrio de Rosebank (Johannesburgo, Sudáfrica), Jade Abbott abrió una pestaña en su ordenador y pidió a ChatGPT que contara del uno al 10 en isiZulu, una lengua hablada por más de 10 millones de personas en su Sudáfrica natal. Los resultados fueron "variados e hilarantes", recuerda Abbott, informática e investigadora.

A continuación, tecleó unas frases en isiZulu y pidió al chatbot que las tradujera al inglés. Una vez más, las respuestas no se acercaron ni de lejos. Aunque se han hecho esfuerzos por incluir ciertas lenguas en los modelos de IA, incluso cuando no se dispone de muchos datos para el entrenamiento, para Abbott estos resultados demuestran que la tecnología "sigue sin detectar nuestras lenguas". 

La experiencia de Abbott refleja la situación de los africanos que no hablan inglés. Muchos modelos lingüísticos como ChatGPT no funcionan de manera adecuada en lenguas con un número reducido de hablantes, sobre todo las africanas. Lelapa AI, una nueva empresa fruto de la colaboración entre Abbott y Pelonomi Moiloa, una ingeniera biomédica, intenta utilizar el aprendizaje automático para crear herramientas que funcionen específicamente para los africanos.

Vulavula, una nueva herramienta de IA que Lelapa presentó el 17 de noviembre, convierte la voz en texto y detecta nombres de personas y lugares en frases escritas. Esto podría ser útil para resumir un documento o buscar a alguien en internet. En la actualidad, puede identificar cuatro lenguas habladas en Sudáfrica, isiZulu, afrikaans, sesotho e inglés; y el equipo está trabajando para incluir otras lenguas de toda África.

La herramienta puede utilizarse por sí sola o integrarse en herramientas de IA ya existentes, como ChatGPT y los chatbots conversacionales online. La esperanza es que Vulavula, que significa "hablar" en xitsonga, haga accesibles aquellas herramientas que ahora no reconocen lenguas africanas.

La falta de herramientas de IA que funcionen en lenguas africanas y reconozcan nombres y lugares de África excluye a la población de oportunidades económicas, según afirma Moiloa, CEO y cofundadora de Lelapa AI. Para ella, trabajar en la creación de soluciones de IA enfocadas en África es una forma de ayudar a otros africanos a aprovechar los inmensos beneficios potenciales de las tecnologías de IA. "Intentamos resolver problemas reales y devolver el poder a nuestra gente", añade. 

"No podemos esperarles"  

Hay miles de lenguas en el mundo, entre 1.000 y 2.000 de ellas solo en África, y se calcula que el continente cuenta con un tercio de los idiomas del planeta. Aunque los hablantes nativos de inglés solo representan el 5% de la población mundial, este idioma domina la web y ahora también las herramientas de IA. 

Ya existen algunos esfuerzos para corregir este desequilibrio. El GPT-4 de OpenAI ha incluido idiomas menos hablados, como el islandés. En febrero de 2020, Google Translate empezó a admitir cinco nuevas lenguas que son habladas por unos 75 millones de personas. Aunque las traducciones son superficiales, la herramienta a menudo se equivoca con las lenguas africanas y aún queda mucho camino por recorrer para conseguir una representación digital precisa de las lenguas africanas, según admitieron los investigadores africanos de IA.

Por ejemplo, Asmelash Teka Hadgu, informático etíope, realizó los mismos experimentos que Abbott con ChatGPT en una importante conferencia sobre IA en Kigali (Ruanda) a principios de 2023. Cuando hizo preguntas al chatbot en tigrinya, su lengua materna, las respuestas que obtuvo fueron un galimatías. "Generaba palabras sin sentido", explicó Hadgu, cofundador de Lesan, una empresa berlinesa (Alemania) de IA que desarrolla herramientas de traducción para las lenguas etíopes.

Lelapa AI y Lesan solo son dos de las start-ups que desarrollan herramientas de reconocimiento de voz para lenguas africanas. En febrero de 2023, Lelapa AI recaudó 2,5 millones de dólares (2,3 millones de euros) en capital semilla, y la empresa tiene prevista la próxima ronda de financiación en 2025. Pero los emprendedores africanos afirman que se enfrentan a grandes obstáculos, como la falta de financiación, el acceso limitado a los inversores y las dificultades para entrenar a la IA para que aprenda diversas lenguas africanas. "La IA recibe la menor financiación entre las empresas tecnológicas africanas", declaró Abake Adenle, fundador de AJALA, una start-up con sede en Londres (Reino Unido) que automatiza la voz en lenguas africanas. 

Las start-ups de IA que trabajan para crear productos compatibles con las lenguas africanas suelen ser ignoradas por los inversores, según Hadgu, debido al pequeño tamaño del mercado potencial, la falta de apoyo político y la deficiente infraestructura de internet. Sin embargo, Hadgu afirma que las pequeñas start-ups africanas como Lesan, GhanaNLP y Lelapa AI desempeñan un papel importante. "Las grandes empresas tecnológicas no prestan atención a nuestras lenguas", afirma, y añade: "No podemos esperarlas". 

Un modelo para la IA africana

Lelapa AI intenta crear un nuevo paradigma para los modelos de IA en África, afirma Vukosi Marivate, científico de datos del equipo de IA de la empresa. En lugar de recurrir solo a internet para recopilar datos con los que entrenar su modelo, como hacen las empresas occidentales, Lelapa AI trabaja tanto de manera online como offline con lingüistas y comunidades locales para recopilar datos, anotarlos e identificar casos de uso donde la herramienta podría resultar problemática.

Bonaventure Dossou, investigador de Lelapa AI especializado en procesamiento del lenguaje natural (NLP, por sus siglas en inglés), asegura que trabajar con lingüistas les permite desarrollar un modelo específico y pertinente para cada contexto y cultura. "Incorporar la sensibilidad cultural y las perspectivas lingüísticas mejora el sistema tecnológico", afirma Dossou. Por ejemplo, el equipo de IA de Lelapa creó algoritmos de análisis de sentimientos y tonos adaptados a lenguas específicas.

Marivate y sus colegas de Lelapa AI imaginan un futuro donde las tecnologías de IA trabajen para los africanos y los representen. En 2019, Marivate y Abbott fundaron Masakhane, una iniciativa comunitaria cuyo objetivo es promover la investigación de NLP en lenguas africanas. La iniciativa ahora cuenta con miles de voluntarios, programadores e investigadores que trabajan juntos para construir modelos de NLP con un enfoque centrado en África.

Es importante que Vulavula y otras herramientas de IA sean construidas por africanos y para africanos, concluye Moiloa: "Somos los custodios de nuestras lenguas, y deberíamos ser los constructores de tecnologías que funcionen para nuestras lenguas".          

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. El polígrafo de la IA: esta herramienta ayuda a detectar patrañas en chatbots

    En muchas situaciones de alto riesgo, no merece la pena arriesgarse con grandes modelos lingüísticos. Saber qué resultados hay que desechar puede arreglarlo. 

    Un toro mirando al frente con una máquina de polígrafo alrededor del cuello. Detrás, espirales de texto superpuestas.
  2. La ley de la IA de la UE en cuatro claves

    El trabajo duro empieza ahora.

    Un candado azul con las estrellas amarillas de la UE de fondo
  3. La IA generativa puede convertir tus recuerdos en fotos que nunca existieron

    El proyecto Synthetic Memories ayuda a familias de todo el mundo a recuperar un pasado que nunca se fotografió

    Una imagen en blanco y negro generada por ai de una mujer y un niño mirando por una ventana