"Modèle universel de la parole"
Google a dévoilé le mardi 7 mars les premiers éléments de sa recherche visant à développer une intelligence artificielle capable de traduire ses services dans 1000 langues différentes à terme. Actuellement, les services en ligne de Google, tels que Google Traduction, ne sont disponibles que dans 130 langues, alors que le monde compte plus de 7000 langues répertoriées.
Ce projet d'intelligence artificielle, dévoilé pour la première fois en novembre dernier, a été baptisé "modèle universel de la parole" (pour universal speech model, en anglais). Sa particularité: être entraîné à la fois sur de l'oral et de l'écrit.
Google explique dans un billet de blog dédié à ses projets de recherche que le modèle a été entraîné à partir de "12 millions d'heures d'enregistrements vocaux et de 28 milliards de phrases écrites provenant de plus de 300 langues". Ce modèle d'intelligence artificielle est utilisé pour générer des sous-titres sur YouTube, la plateforme vidéo de la société.
Ce projet d'intelligence artificielle, dévoilé pour la première fois en novembre dernier, a été baptisé "modèle universel de la parole" (pour universal speech model, en anglais). Sa particularité: être entraîné à la fois sur de l'oral et de l'écrit.
Google explique dans un billet de blog dédié à ses projets de recherche que le modèle a été entraîné à partir de "12 millions d'heures d'enregistrements vocaux et de 28 milliards de phrases écrites provenant de plus de 300 langues". Ce modèle d'intelligence artificielle est utilisé pour générer des sous-titres sur YouTube, la plateforme vidéo de la société.
Des données difficiles à trouver
Le modèle est capable de reconnaître automatiquement la parole dans plus d'une centaine de langues, qu'elles soient très courantes comme l'anglais ou le mandarin, ou qu'il s'agisse de dialectes. Cependant, pour certaines langues qui sont parlées par moins de vingt millions de personnes, Google souligne que la recherche des données nécessaires pour entraîner l'intelligence artificielle est "très difficile".
L'entreprise américaine se montre optimiste : "Notre processus d'apprentissage du modèle est efficace pour s'adapter à de nouvelles langues et à de nouvelles données."
En novembre dernier, Google a déclaré que le projet prendrait plusieurs années pour être achevé et qu'il serait déployé progressivement dans divers services de la société technologique, tels que les claviers numériques et Google Traduction.
L'odj avec BFMTV
L'entreprise américaine se montre optimiste : "Notre processus d'apprentissage du modèle est efficace pour s'adapter à de nouvelles langues et à de nouvelles données."
En novembre dernier, Google a déclaré que le projet prendrait plusieurs années pour être achevé et qu'il serait déployé progressivement dans divers services de la société technologique, tels que les claviers numériques et Google Traduction.
L'odj avec BFMTV