L’utilisation de l’IA pour rationaliser la découverte de médicaments explose. Les chercheurs déploient des modèles d’apprentissage automatique pour les aider à identifier des molécules, parmi des milliards d’options, susceptibles de posséder les propriétés qu’ils recherchent pour développer de nouveaux médicaments.
Mais il y a tellement de variables à prendre en compte – depuis le prix des matériaux jusqu’au risque que quelque chose se passe mal – que même lorsque les scientifiques utilisent l’IA, évaluer les coûts de synthèse des meilleurs candidats n’est pas une tâche facile.
Les innombrables défis liés à l’identification des molécules les meilleures et les plus rentables à tester sont l’une des raisons pour lesquelles les nouveaux médicaments prennent autant de temps à se développer, ainsi qu’un facteur clé des prix élevés des médicaments sur ordonnance.
Pour aider les scientifiques à faire des choix judicieux, les chercheurs du MIT ont développé un cadre algorithmique permettant d'identifier automatiquement les candidats moléculaires optimaux, ce qui minimise le coût de synthèse tout en maximisant la probabilité que les candidats possèdent les propriétés souhaitées. L'algorithme identifie également les matériaux et les étapes expérimentales nécessaires à la synthèse de ces molécules.
Leur cadre quantitatif, connu sous le nom de Synthesis Planning and Rewards-based Route Optimization Workflow (SPARROW), prend en compte les coûts de synthèse d'un lot de molécules à la fois, puisque plusieurs candidats peuvent souvent être dérivés de certains des mêmes composés chimiques. De plus, cette approche unifiée capture des informations clés sur la conception moléculaire, la prédiction des propriétés et la planification de la synthèse à partir de référentiels en ligne et d'outils d'IA largement utilisés.
L'article est publié dans la revue Science informatique de la nature.
En plus d'aider les sociétés pharmaceutiques à découvrir plus efficacement de nouveaux médicaments, SPARROW pourrait être utilisé dans des applications telles que l'invention de nouveaux produits agrochimiques ou la découverte de matériaux spécialisés pour l'électronique organique.
“La sélection de composés est actuellement un art, et parfois un art très réussi. Mais parce que nous disposons de tous ces autres modèles et outils prédictifs qui nous donnent des informations sur la façon dont les molécules pourraient fonctionner et comment elles pourraient être synthétisées. , nous pouvons et devons utiliser ces informations pour guider les décisions que nous prenons », déclare Connor Coley, professeur adjoint en développement de carrière de la promotion 1957 dans les départements de génie chimique, de génie électrique et d'informatique du MIT, et auteur principal d'un article sur MOINEAU.
Coley est rejoint sur l'article par l'auteur principal Jenna Fromer.
Considérations de coûts complexes
Dans un sens, la question de savoir si un scientifique doit synthétiser et tester une certaine molécule se résume à une question de coût de synthèse par rapport à la valeur de l’expérience. Cependant, la détermination du coût ou de la valeur constitue en soi un problème difficile.
Par exemple, une expérience peut nécessiter des matériaux coûteux ou présenter un risque élevé d’échec. Du côté des valeurs, on pourrait se demander dans quelle mesure il serait utile de connaître les propriétés de cette molécule ou si ces prédictions comportent un haut niveau d’incertitude.
Dans le même temps, les sociétés pharmaceutiques ont de plus en plus recours à la synthèse par lots pour améliorer l’efficacité. Au lieu de tester les molécules une par une, ils utilisent des combinaisons de composants chimiques pour tester plusieurs candidats à la fois. Cependant, cela signifie que les réactions chimiques doivent toutes nécessiter les mêmes conditions expérimentales. Cela rend l’estimation du coût et de la valeur encore plus difficile.
SPARROW relève ce défi en considérant les composés intermédiaires partagés impliqués dans la synthèse des molécules et en intégrant ces informations dans sa fonction coût/valeur.
“Lorsque vous pensez à ce jeu d'optimisation consistant à concevoir un lot de molécules, le coût d'ajout d'une nouvelle structure dépend des molécules que vous avez déjà choisies”, explique Coley.
Le cadre prend également en compte des éléments tels que les coûts des matières premières, le nombre de réactions impliquées dans chaque voie de synthèse et la probabilité que ces réactions réussissent du premier coup.
Pour utiliser SPARROW, un scientifique fournit un ensemble de composés moléculaires qu’il envisage de tester et une définition des propriétés qu’il espère trouver.
À partir de là, SPARROW collecte des informations sur les molécules et leurs voies de synthèse, puis évalue la valeur de chacune d'elles par rapport au coût de synthèse d'un lot de candidats. Il sélectionne automatiquement le meilleur sous-ensemble de candidats répondant aux critères de l'utilisateur et trouve les voies de synthèse les plus rentables pour ces composés.
“Toute cette optimisation est effectuée en une seule étape, ce qui permet de réellement capturer simultanément tous ces objectifs concurrents”, explique Fromer.
Un cadre polyvalent
SPARROW est unique car il peut incorporer des structures moléculaires conçues à la main par des humains, celles qui existent dans des catalogues virtuels ou des molécules inédites qui ont été inventées par des modèles d'IA générative.
“Nous avons toutes ces différentes sources d'idées. Une partie de l'attrait de SPARROW réside dans le fait que vous pouvez prendre toutes ces idées et les mettre sur un pied d'égalité”, ajoute Coley.
Les chercheurs ont évalué SPARROW en l'appliquant à trois études de cas. Les études de cas, basées sur des problèmes réels rencontrés par les chimistes, ont été conçues pour tester la capacité de SPARROW à trouver des plans de synthèse rentables tout en travaillant avec un large éventail de molécules d'entrée.
Ils ont constaté que SPARROW capturait efficacement les coûts marginaux de la synthèse par lots et identifiait les étapes expérimentales communes et les produits chimiques intermédiaires. En outre, il pourrait évoluer pour traiter des centaines de candidats moléculaires potentiels.
« Dans la communauté de l'apprentissage automatique pour la chimie, il existe de nombreux modèles qui fonctionnent bien pour la rétrosynthèse ou la prédiction des propriétés moléculaires, par exemple, mais comment les utilisons-nous réellement ? Notre cadre vise à faire ressortir la valeur de ces travaux antérieurs. “En créant SPARROW, nous espérons pouvoir guider d'autres chercheurs dans leur réflexion sur la sous-sélection composée en utilisant leurs propres fonctions de coût et d'utilité”, déclare Fromer.
À l’avenir, les chercheurs souhaitent intégrer une complexité supplémentaire à SPARROW. Par exemple, ils aimeraient permettre à l’algorithme de considérer que la valeur du test d’un composé peut ne pas toujours être constante. Ils souhaitent également inclure davantage d’éléments de chimie parallèle dans sa fonction coût/valeur.
“Le travail de Fromer et Coley aligne mieux la prise de décision algorithmique sur les réalités pratiques de la synthèse chimique. Lorsque des algorithmes de conception informatique existants sont utilisés, le travail consistant à déterminer la meilleure façon de synthétiser l'ensemble des conceptions est laissé au chimiste médicinal, ce qui entraîne moins de problèmes.” des choix optimaux et du travail supplémentaire pour le chimiste médicinal”, déclare Patrick Riley, vice-président senior de l'intelligence artificielle chez Relay Therapeutics, qui n'a pas participé à cette recherche.
“Cet article montre une voie de principe pour inclure la prise en compte de la synthèse conjointe, qui, je l'espère, aboutira à des conceptions algorithmiques de meilleure qualité et plus acceptées.”
« Identifier les composés à synthétiser d'une manière qui équilibre soigneusement le temps, le coût et le potentiel de progrès vers les objectifs tout en fournissant de nouvelles informations utiles est l'une des tâches les plus difficiles pour les équipes de découverte de médicaments.
“L'approche SPARROW de Fromer et Coley le fait de manière efficace et automatisée, fournissant un outil utile aux équipes de chimie médicinale humaine et franchissant des étapes importantes vers des approches totalement autonomes de la découverte de médicaments”, ajoute John Chodera, chimiste computationnel au Memorial Sloan Kettering. Cancer Center, qui n’a pas participé à ces travaux.
Plus d'information:
Jenna C. Fromer et al, Un cadre algorithmique pour une prise de décision synthétique tenant compte des coûts dans la conception moléculaire, Science informatique de la nature (2024). DOI : 10.1038/s43588-024-00639-y
Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche, de l'innovation et de l'enseignement du MIT.
Citation: Pour rationaliser la découverte de médicaments, l'équipe développe un cadre algorithmique pour identifier les candidats moléculaires optimaux (17 juin 2024) récupéré le 18 juin 2024 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.