Alors que Microsoft et Google se demandent quel chatbot AI est meilleur, ce n’est pas la seule utilisation pour l’apprentissage automatique et les modèles de langage. Parallèlement aux rumeurs de plans visant à présenter plus de 20 produits alimentés par l’intelligence artificielle lors de son événement annuel I/O cette année, Google progresse vers son objectif de créer un modèle de langage d’IA prenant en charge 1 000 langues différentes. Dans une mise à jour publiée lundiGoogle a partagé plus d’informations sur le Universal Speech Model (USM), un système que Google décrit comme une “première étape critique” dans la réalisation de ses objectifs.
En novembre dernier, la société a annoncé son intention de créer un modèle linguistique prenant en charge 1 000 des langues les plus parlées au monde tout en révélant également son modèle USM. Google décrit USM comme “une famille de modèles de parole à la pointe de la technologie” avec 2 milliards de paramètres entraînés sur 12 millions d’heures de parole et 28 milliards de phrases dans plus de 300 langues.
USM, que YouTube utilise déjà pour générer des sous-titres codés, prend également en charge la reconnaissance vocale automatique (ASR). Cela détecte et traduit automatiquement les langues, y compris l’anglais, le mandarin, l’amharique, le cebuano, l’assamais, etc.
À l’heure actuelle, Google affirme que l’USM prend en charge plus de 100 langues et servira de “base” pour construire un système encore plus étendu. Meta travaille sur un outil de traduction AI similaire qui en est encore à ses débuts. Vous pouvez en savoir plus sur USM et son fonctionnement dans le document de recherche Google posté ici.
Une destination pour la technologie pourrait être à l’intérieur de lunettes de réalité augmentée comme le concept que Google a présenté lors de son événement I/O l’année dernière, capable de détecter et de fournir des traductions en temps réel qui apparaissent juste devant vos yeux. Cette technologie semble encore un peu lointaine, cependant, et la fausse représentation de Google sur le langue arabe pendant les E/S prouve à quel point il peut être facile de se tromper.