Agroécologie 3 min

Une nouvelle protéine conçue par une Intelligence Artificielle

L’objectif de l’Intelligence Artificielle (IA) est de permettre à un ordinateur de (mieux) résoudre les problèmes traités par les humains. À Toulouse, une IA utilisant des algorithmes de raisonnement automatique, a été utilisée en bioinformatique pour créer une protéine hyper-stable qui s’assemble seule. C’est le résultat d’un travail impliquant le laboratoire Mathématiques et Informatique Appliquées de Toulouse (MIAT), en collaboration avec la Belgique et le Japon.

Publié le 02 janvier 2019

illustration Une nouvelle protéine conçue par une Intelligence Artificielle
© INRAE

Le raisonnement automatique est un domaine de l’IA qui vise en particulier à faire résoudre par l’ordinateur des casse-têtes extrêmement complexes, impliquant des milliers ou millions de paramètres inter-dépendants. L’une de ces IA a ainsi récemment prouvé un théorème qui avait résisté aux efforts des mathématiciens depuis des décennies. Grâce à l’IA développé dans le logiciel ToulBar2 (voir encadré), résoudre le plus difficile des Sudokus demande seulement quelques millisecondes. Mais il y a des casse-tête, plus difficiles, dont la résolution n’est pas aussi simple. 

 

Les protéines sont les principales molécules de la vie. Elles sont à la base du fonctionnement des cellules chez l’homme, les animaux, les plantes, les champignons et les microbes. Elles peuvent se lier à d'autres molécules ou s’assembler pour construire des structures complexes. Elles peuvent surtout catalyser des réactions chimiques à température et pression ambiantes tout en étant biodégradables. En biologie synthétique, les équipes toulousaines tentent d’accélérer la conception de nouvelles protéines. Si les réseaux de neurones artificiels sont à la base de nombreux progrès récents dans le domaine de l’IA, c’est une autre technologie qui a été utilisée ici : les algorithmes de raisonnement automatique.

 

En collaboration avec des biochimistes de la KU Leuven (Belgique) et de l’institut Riken (Japon), ToulBar2 a été chargé de créer une protéine en sélectionnant et organisant ses atomes de manière à ce que ses copies s’assemblent automatiquement dans l’eau pour former une protéine symétrique de plus grande taille. En utilisant une structure préliminaire et une représentation approximative de forces intermoléculaires connues comme le champ de force Talaris14 (issue du logiciel Rosetta, Université de Washington), ToulBar2 a résolu un casse-tête qui avait plus de combinaisons que le nombre d’atomes connus dans tout l’univers. Il a néanmoins été capable de trouver une organisation optimale des atomes et de prouver que c’était la meilleure possible pour Talaris14. Aucun super-calculateur n’est nécessaire, ToulBar2 se contente d’un simple ordinateur de bureau. Les plans de la protéine ainsi conçue (sa séquence d’acides aminés) a ensuite été encodé en ADN et inséré dans une bactérie (E. coli). Celle-ci s’est multipliée et a synthétisé un grand nombre de copies de la protéine. La protéine finale a été cristallisée : sa forme est bien celle attendue. Elle est obtenue par l’assemblage dans l’eau des composants élémentaires conçus par ToulBar2.

 

Ces nouvelles protéines ont un fort potentiel d’application en médecine, en chimie verte, dans les biocarburants ou pour le recyclage. Avoir la capacité de concevoir de nouvelles protéines sur mesure est donc un enjeu majeur pour la santé et peut potentiellement réduire notre empreinte environnementale.

 

ToulBar2, le logiciel qui vient à bout des casse-têtes les plus complexes !

ToulBar2 est un logiciel créé par les équipes du laboratoire MIAT du centre INRAE Occitanie-Toulouse basé sur des algorithmes de raisonnement automatique, spécialisé dans la résolution de casse-têtes complexes impliquant des éléments qu’il faut sélectionner dans un ensemble fini. Ces problèmes sont difficiles à résoudre y compris pour les ordinateurs (ils sont dits « NP-complets »). Un exemple célèbre de tels problèmes est le Sudoku. Dans un Sudoku, chaque cellule contient un nombre entre 1 et 9. Et chaque nombre dans une ligne, une colonne ou un bloc de trois par trois doit être différent. À partir de ces règles et d’une grille de Sudoku, Toulbar2 produit instantanément sa solution. La force de ToulBar2 est qu’il n’est pas restreint à des règles logiques : il peut aussi gérer des règles impliquant des coûts (ex : une règle selon laquelle il est interdit d’avoir deux chiffres dans les cellules adjacentes qui ne diffèrent que d’un, avec une amende associée pour une infraction de 100 unités de coût). Quand de telles règles existent, ToulBar2 produit la solution la moins coûteuse et prouvera également qu’il n’y en a pas de meilleure. Grâce à cette faculté, il peut résoudre des casse-têtes bien plus complexes qu’un Sudoku. ToulBar2 et ses auteurs ont appris et amélioré la conception des protéines grâce à une collaboration de longue date avec l’INSA-LISBP.

Références de publications

Noguchi, H., Addy, C., Simoncini, D., Wouters, S., Mylemans, B., Van Meervelt, L., Schiex, T., Zhang, K.Y., Tame, J.R.H. and Voet, A.R.D., 2019. Computational design of symmetrical eight-bladed β-propeller proteins. IUCrJ6(1).

https://journals.iucr.org/m/issues/2019/01/00/jt5028/index.html

https://doi.org/10.1107/S205225251801480X

 

Allouche, D., André, I., Barbe, S., Davies, J., De Givry, S., Katsirelos, G., O'Sullivan, B., Prestwich, S., Schiex, T. and Traoré, S., 2014. Computational protein design as an optimization problem. Artificial Intelligence212, pp.59-79.

https://www.sciencedirect.com/science/article/pii/S0004370214000332

https://doi.org/10.1016/j.artint.2014.03.005


Simoncini, D., Allouche, D., de Givry, S., Delmas, C., Barbe, S. and Schiex, T., 2015. Guaranteed discrete energy optimization on large protein design problems. Journal of chemical theory and computation11(12), pp.5980-5989.

https://pubs.acs.org/doi/abs/10.1021/acs.jctc.5b00594

https://doi.org/10.1021/acs.jctc.5b00594 


Contacts

Thomas SCHIEX Directeur de Recherche Informaticien Mathématiques et Informatique Appliquées Toulouse (MIAT)

Le centre

Les départements

En savoir plus

Société et territoires

Quelle transition numérique pour l’Enseignement supérieur et la Recherche ?

COMMUNIQUE DE PRESSE - Le 27 juin 2019 a été dévoilée une étude dédiée à la « transition numérique et aux pratiques de recherche et d’enseignement supérieur » menée par l’Inra et l’Institut agronomique, vétérinaire et forestier de France, Agreenium. Cette prospective met en évidence 4 scénarios présageant l’avenir de l’enseignement supérieur et de la recherche au vu des évolutions possibles de l’usage des outils numériques, à toutes les échelles. Si l’idée d’un tout numérique semble peu plausible, les outils de nouvelle génération inviteront les institutions à définir une stratégie collective pour intégrer le numérique dans notre société en transition.

23 décembre 2019

Société et territoires

Le centre INRAE Occitanie-Toulouse, partie prenante du projet ANITI sur l’intelligence artificielle

Le projet toulousain ANITI (Artificial and Natural Intelligence Toulouse Institute) a obtenu une labellisation 3iA faisant de lui un des quatre instituts interdisciplinaires en intelligence artificielle français. Ces structures souhaitées par le Gouvernement travailleront en réseau afin de faire de la France un des leaders mondiaux en intelligence artificielle. Le centre INRAE Occitanie-Toulouse est partie prenante de cette dynamique.

13 février 2020

Alimentation, santé globale

Daniel Tomé, un homme de références

Daniel Tomé, directeur de l’unité Physiologie de la nutrition et du comportement alimentaire, n’est jamais stressé. Il parle des recherches de son labo sur le métabolisme des protéines et de leur retentissement mondial pour la santé humaine avec simplicité et pédagogie. C’est un blagueur aussi… avec une expertise scientifique saluée par tous et un discours visionnaire sur les recherches en nutrition humaine.

26 décembre 2019