L'IA de Meta peut traduire des dizaines de langues sous-financées


Architecture de l'approche enseignant-élève LASER3. Crédit: Nature (2024). DOI : 10.1038/s41586-024-07335-x

La technologie derrière le modèle d'intelligence artificielle de Meta, capable de traduire 200 langues différentes, est décrite dans un article publié dans Nature. Le modèle augmente le nombre de langues pouvant être traduites via la traduction automatique.

Les modèles de traduction automatique neuronale utilisent des réseaux de neurones artificiels pour traduire les langues. Ces modèles ont généralement besoin d'une grande quantité de données accessibles en ligne pour s'entraîner, qui peuvent ne pas être publiques, bon marché ou couramment disponibles pour certaines langues, appelées « langues à faibles ressources ». Augmenter la production linguistique d'un modèle en termes du nombre de langues qu'il traduit pourrait affecter négativement la qualité des traductions du modèle.

Marta Costa-jussà et l'équipe No Language Left Behind (NLLB) ont développé une approche multilingue qui permet aux modèles de traduction automatique neuronale d'apprendre à traduire des langues à faibles ressources en utilisant leur capacité préexistante à traduire des langues à ressources élevées.

En conséquence, les chercheurs ont développé un outil de traduction multilingue en ligne, appelé NLLB-200, qui comprend 200 langues, contient trois fois plus de langues à faibles ressources que de langues à ressources élevées et fonctionne 44 % mieux que les systèmes préexistants.

Étant donné que les chercheurs n'avaient accès qu'à 1 000 à 2 000 échantillons de nombreuses langues à faibles ressources, pour augmenter le volume de données de formation pour NLLB-200, ils ont utilisé un système d'identification de langue pour identifier davantage d'instances de ces dialectes donnés. L'équipe a également extrait des données textuelles bilingues provenant d'archives Internet, ce qui a contribué à améliorer la qualité des traductions fournies par le NLLB-200.

Les auteurs notent que cet outil pourrait aider les personnes parlant des langues rarement traduites à accéder à Internet et à d’autres technologies. En outre, ils soulignent que l’éducation est une application particulièrement importante, dans la mesure où le modèle pourrait aider ceux qui parlent des langues à faibles ressources à accéder à davantage de livres et d’articles de recherche. Cependant, Costa-jussà et ses co-auteurs reconnaissent que des erreurs de traduction peuvent encore survenir.

Plus d'information:
Mise à l'échelle de la traduction automatique neuronale vers 200 langues, Nature (2024). DOI : 10.1038/s41586-024-07335-x

Fourni par Nature Publishing Group

Citation: L'IA de Meta peut traduire des dizaines de langues sous-financées (7 juin 2024) récupéré le 7 juin 2024 sur

Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.



Related posts

Une nouvelle découverte améliore l’efficacité et les profits de la production de bioéthanol

Les sanctuaires d’huîtres restaurés abritent davantage de vie marine malgré les parasites, selon les biologistes

Effacer les « mauvais souvenirs » pour améliorer le traitement à long terme de la maladie de Parkinson