DeepMind développe une IA qui démontre des capacités d'apprentissage social

ObjectifCycle3D. Un espace de tâches simulé physique en 3D. Chaque tâche contient un terrain, des obstacles et des sphères d'objectif générés de manière procédurale, avec des paramètres échantillonnés de manière aléatoire lors de la création de la tâche. Chaque agent est récompensé indépendamment pour avoir visité des objectifs dans un ordre cyclique particulier, également échantillonnés de manière aléatoire lors de la création de tâches. L'ordre correct n'est pas fourni à l'agent, donc un agent doit en déduire l'ordre gratifiant soit par expérimentation, soit via la transmission culturelle d'un expert. Notre espace de tâches présente des défis de navigation d'une complexité illimitée, paramétrés par la taille du monde, la densité des obstacles, les irrégularités du terrain et un certain nombre d'objectifs. Crédit: Communications naturelles (2023). DOI : 10.1038/s41467-023-42875-2

Une équipe de chercheurs en IA du projet DeepMind de Google a développé un type de système d'IA capable de démontrer des capacités d'apprentissage social. Dans leur article publié dans la revue Communications naturellesle groupe décrit comment ils ont développé une application d'IA qui a montré qu'elle était capable d'acquérir de nouvelles compétences dans un monde virtuel en copiant les actions d'un « expert » implanté.

La plupart des systèmes d'IA, tels que ChatGPT, acquièrent leurs connaissances en étant exposés à d'énormes quantités de données, provenant par exemple de référentiels sur Internet. Mais une telle approche, ont noté les acteurs de l’industrie, n’est pas très efficace. C’est pourquoi de nombreux acteurs du domaine continuent de chercher d’autres moyens d’apprendre aux systèmes d’IA à apprendre.

L’une des approches les plus populaires utilisées par les chercheurs consiste à tenter d’imiter le processus par lequel les humains apprennent. À l’instar des applications d’IA traditionnelles, les humains apprennent en s’exposant à des éléments connus d’un environnement et en suivant l’exemple d’autres personnes qui savent ce qu’ils font. Mais contrairement aux applications d’IA, les humains comprennent les choses sans avoir besoin d’un grand nombre d’exemples. Un enfant peut apprendre à jouer au jeu de Jacks, par exemple, après avoir regardé les autres jouer pendant quelques minutes seulement – un exemple de transmission culturelle. Dans ce nouvel effort, l’équipe de recherche a tenté de reproduire ce processus en utilisant l’IA limitée à un monde virtuel.

Le travail de l'équipe consistait d'abord à construire un monde virtuel (appelé GoalCycle3D) composé d'un terrain accidenté sur lequel se trouvaient divers obstacles et sphères multicolores. Ils ont ensuite ajouté des agents IA, censés voyager à travers le monde virtuel en évitant les obstacles et en traversant les sphères. Les agents ont reçu des modules d'apprentissage mais aucune autre information sur le monde dans lequel ils habiteraient. Ils ont acquis des connaissances sur la manière de procéder grâce à l’apprentissage par renforcement.

Crédit: Communications naturelles (2023). DOI : 10.1038/s41467-023-42875-2

Pour amener les agents à apprendre, ils ont reçu des récompenses et ont été autorisés à se frayer un chemin à travers plusieurs mondes virtuels similaires, encore et encore. Ce faisant, les agents ont pu se frayer un chemin à travers le monde virtuel jusqu'à la destination souhaitée. Les chercheurs ont ensuite ajouté une autre fonctionnalité au monde virtuel : des agents experts qui connaissaient déjà le meilleur moyen de se rendre d'un endroit à un autre sans se heurter à des obstacles. Dans le nouveau scénario, les agents non experts ont vite compris que le moyen le plus rapide d’arriver à une destination souhaitée était d’apprendre auprès d’un expert.

En observant les agents apprendre, les chercheurs ont constaté qu'ils faisaient beaucoup plus rapidement avec l'expert et qu'ils étaient capables de mieux naviguer dans d'autres nouveaux mondes virtuels similaires en imitant ce qu'ils avaient appris de l'expert lors d'essais antérieurs. Ils étaient également capables d’appliquer ces compétences (grâce aux modules de mémoire) même en l’absence de l’expert – un exemple, selon les chercheurs, d’apprentissage social.

Plus d'information:
Avishkar Bhoopchand et al, Apprendre l'imitation en quelques coups comme transmission culturelle, Communications naturelles (2023). DOI : 10.1038/s41467-023-42875-2

Citation: DeepMind développe une IA qui démontre des capacités d'apprentissage social (2023, 4 décembre) récupéré le 4 décembre 2023 sur

Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.

Our Company

About Links

Useful Links

Newsletter

Laest News

Are you sure want to unlock this post?

Are you sure want to cancel subscription?

Queue

DeepMind développe une IA qui démontre des capacités d'apprentissage social

La génération d’images IA augmente l’empreinte carbone, selon une étude

Une nouvelle méthode suit les processus physiques à l’intérieur des parties liquides et solides des batteries Li-ion

You may also like

Leave a Comment Cancel Reply