Une équipe d'informaticiens du projet DeepMind de Google au Royaume-Uni, en collaboration avec un collègue de l'Université du Wisconsin-Madison et un autre de l'Université de Lyon, a développé un programme informatique qui combine un grand modèle de langage (LLM) pré-entraîné avec un ” évaluateur » pour produire des solutions aux problèmes sous forme de code informatique.
Dans leur article publié dans la revue Naturele groupe décrit ses idées, la manière dont elles ont été mises en œuvre et les types de résultats produits par le nouveau système.
Les chercheurs de l’ensemble de la communauté scientifique ont pris note de ce que les gens font avec les LLM, tels que ChatGPT, et beaucoup d’entre eux ont pensé que les LLM pourraient être utilisés pour accélérer le processus de découverte scientifique. Mais ils ont également noté que pour que cela se produise, une méthode est nécessaire pour éviter les confabulations, les réponses qui semblent raisonnables mais erronées – ils ont besoin de résultats vérifiables. Pour résoudre ce problème, l'équipe travaillant au Royaume-Uni a utilisé ce qu'elle appelle un évaluateur automatisé pour évaluer les réponses données par un LLM.
Une fois que le LLM a généré une réponse, celle-ci est envoyée à l'évaluateur. L'évaluateur analyse ensuite la réponse puis la renvoie au LLM avec des suggestions sur la manière d'améliorer ses résultats. Ce processus est répété plusieurs fois et la réponse devient de plus en plus précise. L’équipe de recherche appelle son système FunSearch (abréviation de recherche d’espace fonctionnel). En testant le système, les chercheurs ont constaté qu’il était capable de fournir des résultats vérifiables.
Pour tester davantage FunSearch, les équipes de recherche l'ont utilisé pour trouver de nouvelles découvertes sur ce que l'on appelle le problème de l'ensemble de plafonds, un problème mathématique qui consiste à découvrir le plus grand ensemble de points dans une grille multidimensionnelle où aucun point ne se trouve sur la même ligne. . FunSearch a pu générer des solutions qui n'avaient pas été trouvées auparavant, le tout sous la forme de programmes informatiques en raison de la nature du LLM qu'ils utilisaient.
L'équipe de recherche reconnaît que FunSearch n'est pas adapté à tous les types d'efforts de recherche, mais suggère qu'il représente une étape vers l'utilisation des LLM soit pour trouver des solutions à des problèmes, soit pour stimuler les chercheurs à la recherche de nouvelles façons d'attaquer d'anciens problèmes.
Plus d'information:
Bernardino Romera-Paredes et al, Découvertes mathématiques issues de la recherche de programmes avec de grands modèles de langage, Nature (2023). DOI : 10.1038/s41586-023-06924-6
Deepmind : deepmind.google/discover/blog/… rge-langage-models/
© 2023 Réseau Science X
Citation: Un moyen de recherche de nouvelles solutions en mathématiques et en informatique à l'aide d'un LLM et d'un évaluateur (15 décembre 2023) récupéré le 15 décembre 2023 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.