L’Afrique subsaharienne est l’une des régions les plus riches au monde sur le plan linguistique, avec plus de 2 000 langues recensées. Pourtant, moins de 5 % d’entre elles disposent aujourd’hui de ressources suffisantes pour être intégrées efficacement dans les outils de traitement automatique du langage. Résultat : les technologies vocales actuelles restent souvent peu performantes pour de nombreux utilisateurs africains.
C’est dans ce contexte que Google a annoncé le lancement officiel de WAXAL, une base de données vocale open source conçue pour accélérer le développement d’intelligences artificielles capables de comprendre et de restituer les langues africaines. Ce projet, mené sur une période de trois ans avec plusieurs institutions du continent, répond à un manque majeur : l’insuffisance de données linguistiques, longtemps considérée comme un frein à l’essor de l’IA vocale en Afrique.
Disponible gratuitement sur la plateforme Hugging Face, WAXAL regroupe plus de 11 000 heures d’enregistrements, réparties dans près de deux millions de fichiers audio. La base couvre 21 langues africaines, notamment le haoussa, le yoruba, le luganda, l’acholi, le swahili, l’igbo ou encore le peul.
La collecte a été réalisée grâce à plusieurs partenaires africains. L’université de Makerere en Ouganda et l’université du Ghana ont supervisé la production de données pour 13 langues. De son côté, l’initiative rwandaise Digital Umuganda a contribué à cinq langues supplémentaires. Des studios régionaux ont également été mobilisés afin de produire des enregistrements de haute qualité. L’Institut africain des sciences mathématiques (AIMS) a participé à la constitution de corpus multilingues en vue de futures extensions du projet.
Pensée comme une infrastructure essentielle, la base met à disposition environ 1 250 heures de parole transcrite destinées à la reconnaissance automatique de la parole, ainsi que plus de 20 heures d’enregistrements en studio pour la synthèse vocale. L’objectif est de faciliter la création d’applications basées sur la voix : assistants vocaux, outils de dictée ou services publics accessibles aux populations peu ou non lettrées, notamment dans des secteurs clés comme la santé, l’éducation ou l’agriculture.
Pour Aisha Walcott-Bryant, responsable de Google Research Africa, WAXAL représente « un socle indispensable pour permettre aux chercheurs et entrepreneurs de développer des technologies adaptées à leurs langues et à leurs réalités ».
Ce lancement s’inscrit dans une dynamique plus large autour des technologies linguistiques africaines. En 2025, le Nigeria a par exemple présenté N-ATLAS, un modèle open source capable de transcrire la parole en yoruba, haoussa, igbo et anglais nigérian. En parallèle, plusieurs start-up africaines travaillent déjà sur des solutions de reconnaissance vocale et de traduction pensées pour les usages locaux.
L’enjeu est énorme : malgré l’extraordinaire diversité linguistique du continent, seules quelques langues disposent actuellement des ressources nécessaires pour être pleinement intégrées dans les systèmes d’IA. Cette sous-représentation prive des millions de personnes de technologies devenues courantes ailleurs.
Enfin, selon le modèle de partenariat choisi, les institutions africaines ayant participé à la collecte conservent la propriété des corpus tout en les rendant disponibles sous licence ouverte. Joyce Nakatumba-Nabende, chercheuse à l’université de Makerere, rappelle ainsi que « pour que l’intelligence artificielle ait un impact réel en Afrique, elle doit pouvoir parler nos langues et refléter nos réalités ».