Une nouvelle recherche montre pourquoi il n’est pas nécessaire d’être parfait pour faire le travail


Construire des programmes comportementaux compacts. (A) En haut : L’espace des stratégies permettant de résoudre une tâche peut être vaste, avec de nombreuses stratégies permettant d’obtenir des performances suffisamment bonnes. En bas : L’étude des relations entre les stratégies pourrait fournir un aperçu de la variabilité comportementale des animaux et des tâches. (B) Configuration générale de la tâche : un animal fait des déductions sur les propriétés cachées de l’environnement pour guider ses actions. (C) Configuration de tâches spécifiques : un animal se nourrit à partir de deux ports dont les probabilités de récompense changent avec le temps. (D) La stratégie optimale sans contrainte consiste en une politique optimale couplée à un observateur idéal bayésien. (E) Nous formulons une stratégie contrainte sous la forme d’un petit programme qui utilise un nombre limité d’états internes pour sélectionner des actions basées sur des actions et des observations passées. (F) Chaque programme génère des séquences d’actions en fonction des résultats des actions passées. (G) La stratégie optimale sans contrainte (D) peut être traduite en un petit programme en discrétisant la mise à jour des croyances mise en œuvre par l’observateur bayésien idéal et couplée à la politique comportementale optimale. En haut : mise à jour des croyances optimales. Milieu : les valeurs de croyance peuvent être divisées en états discrets (cercles pleins) étiquetés par l’action qu’elles spécifient (bleu contre vert). La mise à jour des croyances spécifie les transitions entre les états, selon qu’une récompense a été reçue ou non (flèches pleines ou pointillées). En bas : États et transitions représentés sous forme de programme bayésien. (H) En haut : un programme à 30 états se rapproche de la mise à jour bayésienne en (G) et comporte deux directions d’intégration qui peuvent être interprétées comme une confiance croissante dans l’une ou l’autre option. En bas : le programme bayésien à deux états, gagner-rester, perdre-aller (WSLG), continue d’effectuer la même action en cas de victoire (c’est-à-dire recevoir une récompense) et change d’action en cas de perte (c’est-à-dire ne pas recevoir de récompense). (I) Exemple de comportement produit par le programme bayésien à 30 états en (H). Crédit: Avancées scientifiques (2024). DOI : 10.1126/sciadv.adj4064

Lorsque les neuroscientifiques réfléchissent à la stratégie qu’un animal pourrait utiliser pour accomplir une tâche (comme trouver de la nourriture, chasser une proie ou naviguer dans un labyrinthe), ils proposent souvent un modèle unique qui présente la meilleure façon pour l’animal d’accomplir cette tâche.

Mais dans le monde réel, les animaux – et les humains – peuvent ne pas utiliser la méthode optimale, ce qui peut nécessiter beaucoup de ressources. Au lieu de cela, ils utilisent une stratégie suffisamment efficace pour faire le travail, mais qui demande beaucoup moins de puissance cérébrale.

Dans une nouvelle recherche parue dans Avancées scientifiquesles scientifiques de Janelia ont cherché à mieux comprendre les moyens par lesquels un animal pourrait résoudre un problème avec succès, au-delà de la simple stratégie.

Les travaux montrent qu’il existe un grand nombre de façons pour un animal d’accomplir une tâche simple de recherche de nourriture. Il présente également un cadre théorique pour comprendre ces différentes stratégies, comment elles sont liées les unes aux autres et comment elles résolvent différemment le même problème.

Certaines de ces options imparfaites pour accomplir une tâche fonctionnent presque aussi bien que la stratégie optimale mais avec beaucoup moins d’efforts, ont découvert les chercheurs, libérant ainsi les animaux qui peuvent utiliser de précieuses ressources pour gérer plusieurs tâches.

“Dès que vous vous libérez de la perfection, vous seriez surpris du nombre de façons possibles de résoudre un problème”, explique Tzuhsuan Ma, postdoctorant au Hermundstad Lab, qui a dirigé la recherche.

Le nouveau cadre pourrait aider les chercheurs à commencer à examiner ces stratégies « assez bonnes », notamment pourquoi différents individus pourraient adapter différentes stratégies, comment ces stratégies pourraient fonctionner ensemble et dans quelle mesure les stratégies sont généralisables à d’autres tâches. Cela pourrait aider à expliquer comment le cerveau permet un comportement dans le monde réel.

“Beaucoup de ces stratégies sont des moyens que nous n’aurions jamais imaginés pour résoudre ce problème, mais elles fonctionnent bien, il est donc tout à fait possible que les animaux les utilisent également”, déclare Ann Hermundstad, chef du groupe Janelia. “Ils nous donnent un nouveau vocabulaire pour comprendre les comportements.”

Regarder au-delà de la perfection

La recherche a débuté il y a trois ans lorsque Ma a commencé à s’interroger sur les différentes stratégies qu’un animal pourrait éventuellement utiliser pour accomplir une tâche simple mais courante : choisir entre deux options dont les chances d’être récompensé changent avec le temps.

Les chercheurs souhaitaient examiner un groupe de stratégies qui se situent entre des solutions optimales et des solutions complètement aléatoires : des « petits programmes » aux ressources limitées mais qui font quand même le travail. Chaque programme spécifie un algorithme différent pour guider les actions d’un animal en fonction d’observations passées, lui permettant ainsi de servir de modèle de comportement animal.

Il s’avère qu’il existe de nombreux programmes de ce type : environ un quart de million. Pour donner un sens à ces stratégies, les chercheurs ont d’abord examiné quelques-unes des plus performantes. Étonnamment, ils ont constaté qu’ils faisaient essentiellement la même chose que la stratégie optimale, même s’ils utilisaient moins de ressources.

“Nous avons été un peu déçus”, dit Ma. “Nous avons passé tout ce temps à rechercher ces petits programmes, et ils suivent tous le même calcul que le domaine savait déjà dériver mathématiquement sans tous ces efforts.”

Mais les chercheurs étaient motivés à continuer de chercher : ils avaient la forte intuition qu’il devait exister des programmes bons mais différents de la stratégie optimale. Une fois qu’ils ont regardé au-delà des meilleurs programmes, ils ont trouvé ce qu’ils cherchaient : environ 4 000 programmes entrant dans cette catégorie « assez bons ». Et plus important encore, plus de 90 % d’entre eux ont fait quelque chose de nouveau.

Ils auraient pu s’arrêter là, mais une question d’un autre Janelian les a incités à réfléchir : comment pouvaient-ils déterminer quelle stratégie utilisait un animal ?

La question a incité l’équipe à approfondir le comportement des programmes individuels et à développer une approche systématique pour réfléchir à l’ensemble des stratégies. Ils ont d’abord développé une manière mathématique de décrire les relations entre les programmes à travers un réseau reliant les différents programmes. Ensuite, ils ont examiné le comportement décrit par les stratégies, en concevant un algorithme pour révéler comment l’un de ces programmes « assez bons » pouvait évoluer à partir d’un autre.

Ils ont découvert que de petits changements apportés au programme optimal peuvent entraîner de grands changements de comportement tout en préservant les performances. Si certains de ces nouveaux comportements sont également utiles dans d’autres tâches, cela suggère que le même programme pourrait suffire à résoudre toute une série de problèmes différents.

“Si vous envisagez qu’un animal ne soit pas un spécialiste optimisé pour résoudre un seul problème, mais plutôt un généraliste qui résout de nombreux problèmes, c’est vraiment une nouvelle façon d’étudier cela”, explique Ma.

Ce nouveau travail fournit un cadre permettant aux chercheurs de commencer à réfléchir au-delà de programmes uniques et optimaux pour le comportement animal. L’équipe se concentre désormais sur l’examen du degré de généralisation des petits programmes à d’autres tâches et sur la conception de nouvelles expériences pour déterminer quel programme un animal pourrait utiliser pour effectuer une tâche en temps réel. Ils travaillent également avec d’autres chercheurs de Janelia pour tester leur cadre théorique.

“En fin de compte, bien comprendre le comportement d’un animal est une condition préalable essentielle pour comprendre comment le cerveau résout différents types de problèmes, y compris certains que nos meilleurs systèmes artificiels ne résolvent que de manière inefficace, voire pas du tout”, explique Hermundstad. “Le principal défi est que les animaux pourraient utiliser des stratégies très différentes de celles que nous pourrions initialement supposer, et ce travail nous aide à découvrir cet espace de possibilités.”

Plus d’information:
Tzuhsuan Ma et al, Un vaste espace de stratégies compactes pour des décisions efficaces, Avancées scientifiques (2024). DOI : 10.1126/sciadv.adj4064

Fourni par l’Institut médical Howard Hughes

Citation: Une nouvelle recherche montre pourquoi vous n’avez pas besoin d’être parfait pour faire le travail (24 juin 2024) récupéré le 25 juin 2024 sur

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.



Related posts

L’analyse révèle que la plupart des LLM majeurs en open source et en source fermée ont tendance à pencher à gauche lorsqu’on leur pose des questions à forte connotation politique

Une étude examine la contagion du suicide après le décès de célébrités, ouvrant des pistes de prévention

Sonder la capture du carbone, atome par atome, avec un modèle d’apprentissage automatique