Agroécologie 3 min
Une nouvelle protéine conçue par une Intelligence Artificielle
L’objectif de l’Intelligence Artificielle (IA) est de permettre à un ordinateur de (mieux) résoudre les problèmes traités par les humains. À Toulouse, une IA utilisant des algorithmes de raisonnement automatique, a été utilisée en bioinformatique pour créer une protéine hyper-stable qui s’assemble seule. C’est le résultat d’un travail impliquant le laboratoire Mathématiques et Informatique Appliquées de Toulouse (MIAT), en collaboration avec la Belgique et le Japon.
Publié le 02 janvier 2019
Le raisonnement automatique est un domaine de l’IA qui vise en particulier à faire résoudre par l’ordinateur des casse-têtes extrêmement complexes, impliquant des milliers ou millions de paramètres inter-dépendants. L’une de ces IA a ainsi récemment prouvé un théorème qui avait résisté aux efforts des mathématiciens depuis des décennies. Grâce à l’IA développé dans le logiciel ToulBar2 (voir encadré), résoudre le plus difficile des Sudokus demande seulement quelques millisecondes. Mais il y a des casse-tête, plus difficiles, dont la résolution n’est pas aussi simple.
Les protéines sont les principales molécules de la vie. Elles sont à la base du fonctionnement des cellules chez l’homme, les animaux, les plantes, les champignons et les microbes. Elles peuvent se lier à d'autres molécules ou s’assembler pour construire des structures complexes. Elles peuvent surtout catalyser des réactions chimiques à température et pression ambiantes tout en étant biodégradables. En biologie synthétique, les équipes toulousaines tentent d’accélérer la conception de nouvelles protéines. Si les réseaux de neurones artificiels sont à la base de nombreux progrès récents dans le domaine de l’IA, c’est une autre technologie qui a été utilisée ici : les algorithmes de raisonnement automatique.
En collaboration avec des biochimistes de la KU Leuven (Belgique) et de l’institut Riken (Japon), ToulBar2 a été chargé de créer une protéine en sélectionnant et organisant ses atomes de manière à ce que ses copies s’assemblent automatiquement dans l’eau pour former une protéine symétrique de plus grande taille. En utilisant une structure préliminaire et une représentation approximative de forces intermoléculaires connues comme le champ de force Talaris14 (issue du logiciel Rosetta, Université de Washington), ToulBar2 a résolu un casse-tête qui avait plus de combinaisons que le nombre d’atomes connus dans tout l’univers. Il a néanmoins été capable de trouver une organisation optimale des atomes et de prouver que c’était la meilleure possible pour Talaris14. Aucun super-calculateur n’est nécessaire, ToulBar2 se contente d’un simple ordinateur de bureau. Les plans de la protéine ainsi conçue (sa séquence d’acides aminés) a ensuite été encodé en ADN et inséré dans une bactérie (E. coli). Celle-ci s’est multipliée et a synthétisé un grand nombre de copies de la protéine. La protéine finale a été cristallisée : sa forme est bien celle attendue. Elle est obtenue par l’assemblage dans l’eau des composants élémentaires conçus par ToulBar2.
Ces nouvelles protéines ont un fort potentiel d’application en médecine, en chimie verte, dans les biocarburants ou pour le recyclage. Avoir la capacité de concevoir de nouvelles protéines sur mesure est donc un enjeu majeur pour la santé et peut potentiellement réduire notre empreinte environnementale.
ToulBar2 est un logiciel créé par les équipes du laboratoire MIAT du centre INRAE Occitanie-Toulouse basé sur des algorithmes de raisonnement automatique, spécialisé dans la résolution de casse-têtes complexes impliquant des éléments qu’il faut sélectionner dans un ensemble fini. Ces problèmes sont difficiles à résoudre y compris pour les ordinateurs (ils sont dits « NP-complets »). Un exemple célèbre de tels problèmes est le Sudoku. Dans un Sudoku, chaque cellule contient un nombre entre 1 et 9. Et chaque nombre dans une ligne, une colonne ou un bloc de trois par trois doit être différent. À partir de ces règles et d’une grille de Sudoku, Toulbar2 produit instantanément sa solution. La force de ToulBar2 est qu’il n’est pas restreint à des règles logiques : il peut aussi gérer des règles impliquant des coûts (ex : une règle selon laquelle il est interdit d’avoir deux chiffres dans les cellules adjacentes qui ne diffèrent que d’un, avec une amende associée pour une infraction de 100 unités de coût). Quand de telles règles existent, ToulBar2 produit la solution la moins coûteuse et prouvera également qu’il n’y en a pas de meilleure. Grâce à cette faculté, il peut résoudre des casse-têtes bien plus complexes qu’un Sudoku. ToulBar2 et ses auteurs ont appris et amélioré la conception des protéines grâce à une collaboration de longue date avec l’INSA-LISBP. |
Noguchi, H., Addy, C., Simoncini, D., Wouters, S., Mylemans, B., Van Meervelt, L., Schiex, T., Zhang, K.Y., Tame, J.R.H. and Voet, A.R.D., 2019. Computational design of symmetrical eight-bladed β-propeller proteins. IUCrJ, 6(1). https://journals.iucr.org/m/issues/2019/01/00/jt5028/index.html https://doi.org/10.1107/S205225251801480X
Allouche, D., André, I., Barbe, S., Davies, J., De Givry, S., Katsirelos, G., O'Sullivan, B., Prestwich, S., Schiex, T. and Traoré, S., 2014. Computational protein design as an optimization problem. Artificial Intelligence, 212, pp.59-79. https://www.sciencedirect.com/science/article/pii/S0004370214000332 https://doi.org/10.1016/j.artint.2014.03.005
|