illustration Hadi Quesneville, l’art des données
© INRAE

3 min

Hadi Quesneville, l’art des données

Big data, open science, open data… En sciences, comme dans notre quotidien, les données prennent une importance croissante. Hadi Quesneville figure parmi les premiers administrateurs des données nommés par les instituts de recherche en France. Un métier nouveau, qu’il nous fait découvrir en nous sensibilisant aux nouveaux enjeux de la science ouverte.

Publié le 22 décembre 2020

Pour aider à formaliser et à mettre en œuvre une politique des données scientifiques dans les établissements de la recherche, le Collège « Données de la recherche » du Comité pour la science ouverte a émis sept recommandations dont celle de nommer un administrateur des données et de mettre en place un réseau de correspondants dans les établissements. Fasciné par le génome des plantes, Hadi Quesneville a d’abord intégré INRAE en tant que directeur de recherches et directeur de l’unité Génomique – Info (URGI). Les données faisant partie de son quotidien, il devient, en 2020, le premier administrateur des données d'INRAE. Quel itinéraire l’a conduit à cette responsabilité ? En quoi consiste son métier ?

Une large vision, sur des données toujours plus diversifiées

Après avoir travaillé en tant que maître de conférence à l’Université Pierre et Marie Curie et dans une unité mixte de recherche du CNRS, Hadi Quesneville rejoint l’Inra (devenu INRAE) en 2007, en tant que directeur de recherches et directeur de l’unité Génomique-Info (URGI) spécialisée dans les plantes et leurs bioagresseurs – installée dans un premier temps à Evry, puis à Versailles. « Le génome des plantes m’a toujours fasciné, j’ai donc sauté sur l’opportunité offerte par l’Inra » se souvient-il, enthousiaste. Il dédie alors sa carrière de chercheur à l’analyse des génomes, « et plus particulièrement à ce que l’on n’annote pas encore correctement : les éléments génétiques mobiles, pour en étudier leur évolution et leurs impacts fonctionnels ». Avec son équipe, il développe alors logiciels et bases de données, pour les analyser. En génomique, le nombre de données obtenues ne cesse d’augmenter, il faut donc gérer les problématiques liées à leur diversité et à leur accès : comment les stocker, comment les chercher ? Hadi est amené à repenser la façon dont il stocke les données volumineuses dans les bases de données développées pour ses analyses, et à adapter leurs schémas pour les rendre plus performantes. 

L’ouverture des données, c’est la clé d’un cercle vertueux

En tant que directeur d’unité, il s’est aussi impliqué plus largement dans la construction de systèmes d’information. Il a notamment procédé à la mise en place du portail international « blé », WheatIS, construit sous l’égide de la Wheat initiative. Ceci l’amène, doucement, mais sûrement, plus loin encore dans l’univers intrigant et infini des données. Ces questions fascinent Hadi Quesneville, et, grâce à son profil pluridisciplinaire, il est nommé, le 1er mai 2020, administrateur des données scientifiques. « J’en suis très heureux, car c’est excellent pour ma curiosité personnelle : ces sujets me font sortir du génome pour aller vers d’autres sphères, les sols, le climat, toute la biologie, les sciences économiques et sociales… Sur un autre plan, cela me permet d’aborder aussi bien des questions du côté de la recherche que de celui de sa valorisation : j’ai une vision panoramique, c’est passionnant ».  

Vers la nouvelle révolution industrielle 

Les données impactent profondément nos vies

« Aujourd’hui, beaucoup considèrent les données comme étant à l’origine d’une nouvelle révolution industrielle : notre société est transformée depuis l’arrivée des smartphones, des réseaux sociaux, des applications, des drones, des capteurs ou encore d’internet. Aujourd’hui, beaucoup d’innovations sont basées sur les données ! » s’exclame-t-il. Et en effet, ce nouvel eldorado entraîne des transformations profondes dans la société, les données devenant capitales dans les prises de décisions des entreprises et des gouvernements. Tout ceci impacte profondément nos vies. « INRAE génère toutes sortes de données, il est donc nécessaire de travailler à optimiser leur exploitation, c’est très motivant ! » Dans la pratique, Hadi Quesneville participe à la création des feuilles de routes de certaines directions d’INRAE, comme par exemple celle de la Direction pour la science ouverte et la Direction du partenariat du transfert et de l’innovation. Il est également amené à échanger sur ce sujet à l’extérieur de l’Institut, dans le cadre d’une cellule créée par le Ministère de la recherche regroupant ses homologues des autres instituts par exemple, ou au niveau européen. Passionné d’arts graphiques, Hadi Quesneville fait le rapprochement entre la science et les arts : « dans un cas comme dans l’autre, les échanges et les discussions sont sources d’inspirations, c’est essentiel pour faire venir des idées et faire murir des intuitions. »

Gouvernance, valorisation et acculturation

Ses missions se répartissent en trois axes autour de la donnée : leur gouvernance, leur valorisation et l’acculturation des scientifiques de l’institut à celle-ci. « Je suis le référent sur les sujets traitant des données scientifiques à INRAE, en interne, mais aussi pour l’extérieur aux niveaux national et international. La gouvernance indique qui peut décider le partage des données et quels en sont les modalités. La valorisation consiste à identifier quels peuvent en être leurs usages et leurs usagers. Il est essentiel de comprendre leur valeur scientifique intrinsèque, mais aussi les risques afférents : perte de compétitivité, réputation, données personnelles, données sensibles pour la sécurité des biens, des personnes, de la biodiversité… Les angles de vue sur les données sont très nombreux. Ceux-ci impliquent également un cadre réglementaire encadré par des contrats et des lois. Ainsi, les textes de loi contraignent les administrations à rendre publiques leurs données dans les meilleures conditions possibles tout en autorisant quelques exceptions comme par exemple les données personnelles ou sensibles. » Au quotidien, Hadi Quesneville présente cette gouvernance aux directeurs d’unités, aux chefs de départements ou au collège de direction afin de répondre aux interrogations et de partager les points de vue en interne. Une cellule qu’il anime a été constituée pour instruire les dossiers complexes relevant de la gouvernance, mais aussi pour coordonner les actions mises en œuvre autour des données impliquant les différents acteurs de l’institut. 

Les questions traitées par INRAE sont centrales pour la société

Que ce soit pour les acteurs économiques, la société civile ou les politiques publiques, les données sont devenues incontournables pour développer des stratégies et prendre des décisions. Elles en acquièrent une valeur économique importante « Les questions que l’on traite à INRAE sont des questions centrales pour la société : le changement climatique, le développement durable, ou encore le concept de « One Health » qui consiste à penser la santé à l’interface entre celle des animaux, de l’Homme et de leur environnement. Un concept qui vise notamment à mieux affronter les maladies émergentes à risque pandémique comme la Covid-19. Ces défis pluridisciplinaires nécessitent d’interroger des données issues de plusieurs disciplines : sciences de l’environnement, sciences biologiques, sciences sociales. Il devient capital d’identifier les données nécessaires aux recherches de l’Institut pour en sécuriser l’accès, les promouvoir, et améliorer leur qualité. Tout cela mène au troisième axe : l’acculturation, en sensibilisant les agents INRAE à la gestion de différents types de données, depuis leur collecte jusqu’aux aspects juridiques ou encore à leur valorisation.

La data, un bien de l’humanité

L’open data au cœur de l’éthique des chercheurs

« L’ouverture des données, c’est la clé d’un cercle vertueux, qui renforce l’intégrité en sciences et la qualité des résultats scientifiques. Faciliter la reproduction des résultats en permettant un accès simplifié, cela permet de renforcer leur qualité ! » prône Hadi Quesneville. Et en effet, en plus de gains de temps considérables, le fait de pouvoir réutiliser les données permet de baisser le coût de la science, de faciliter les partenariats, et d’aller vers une éthique autour de la transparence. « L’Open Data est au cœur de l’éthique du chercheur : cela l’aide à mieux travailler, et son travail bénéficie à une large communauté. La science est un bien de l’humanité, une connaissance à partager dans le monde : chacun doit pouvoir se l’approprier » précise l’administrateur des données. L’Open Science permet de rendre la science accessible, que ce soit au niveau des publications, des données, ou même des équipements de laboratoire. Deux sites web complémentaires ont vu le jour afin de promouvoir et valoriser les données INRAE : data.inrae.fr, l’entrepôt institutionnel des données INRAE, et data.partage.inrae.fr, un guide de bonnes pratiques pour les chercheurs, une boussole pour s’orienter dans ce monde des données. « Le site data.inrae.fr propose une solution pour que tous les chercheurs INRAE puissent partager leurs données facilement ».