illustration Pascal Neveu, orchestrer le Big Data
© INRAE, Bertrand Nicolas

Société et territoires 7 min

Pascal Neveu, orchestrer le Big Data

Donner du sens aux données de la recherche agronomiques, tel est le but que poursuit Pascal Neveu depuis de nombreuses années, développant avec succès une nouvelle génération de méthodes relatives à l’intégration, à la structuration et à la valorisation de masses de données hétérogènes. Il reçoit le laurier Innovation pour la recherche 2019 de l'Inra.

Publié le 18 novembre 2019

Depuis son plus jeune âge (ou presque), Pascal Neveu affectionne abstraction et formalisme. Conjuguant mathématique, statistique et informatique, il s’est attaché à développer des méthodes d’analyse des systèmes relevant de l'agronomie et de l'environnement. Au cœur du centre Inra Occitanie-Montpellier, il est ingénieur dans l’inité Mathématiques, informatique et statistique pour l'environnement et l'agronomie (Mistea) qu’il dirige par ailleurs. Capable de faire fructifier des compétences complémentaires et d’entrainer des collectifs dans des directions nouvelles et innovantes, il est un spécialiste reconnu de la gestion de données massives et hétérogènes pour l’agronomie. Son parcours dans l’ingénierie du numérique lui vaut de recevoir aujourd’hui le Laurier Inra 2019 « Innovation pour la recherche ».

 

Se nourrir de la diversité

Après des études en mathématiques appliquées, Pascal Neveu se consacre aux statistiques. Dès 1983, il est recruté à l’Inra en qualité de consultant statisticien dans ce qui est alors l’unité de Biométrie du centre de recherche de Jouy-en-Josas. En lien étroit avec ses collègues, il choisit et met en œuvre les méthodes statistiques pertinentes pour traiter leurs données. Du porc au cheval, de la viande au lait, ses objets comme ses contacts sont variés. « Je trouvais ça passionnant de rencontrer plein d’équipes différentes » se souvient-il avec enthousiasme. Cette variété le sensibilise très tôt au dialogue autour des données qui sont produites. « Aujourd’hui, je suis certainement armé de tout ce passé quand je vais discuter avec les gens » concède-t-il.
Quelques années passent, Pascal s’investit dans l’informatique. Direction Montpellier où il travaille désormais sur les réseaux de neurones artificiels - comprenez un système informatique dont le fonctionnement est calqué sur celui des neurones du cerveau humain- qui servent notamment à piloter des procédés. Il se passionne pour l’intelligence artificielle.

Donner du sens aux données

Dans le même temps, les systèmes de stockage, de fouille et d'analyse de l'information numérisée progressent, le Big Data émerge. Pascal Neveu fait sienne la réflexion qui anime alors la sphère scientifique - dont ses collègues Inra - autour de l’acquisition, de la gestion, de l’analyse et de l’utilisation des données massives et des méthodes et outils nécessaires pour les traiter, les partager et les réutiliser. Il convenait plus que jamais de donner du sens aux données - les mettre en perspective, introduire des connaissances, raisonner à long terme tout en considérant les conséquences des décisions prises...

« Il y a là un véritable enjeu pour l’Institut » souligne-t-il d’autant que « les recherches de plus en plus collaboratives sont à l’origine de données dont le volume et la complexité vont croissant et qu’Internet donne accès à des sources de données qui sont distantes », poursuit-il..  

Faire des données un vrai capital numérique

A l’aube des années 2000, Pascal s’empare du challenge qui entoure les données, celui de les trouver et de les lier afin de donner de la valeur à l’information pour, in fine, répondre à de grandes questions de science ou de société. « Il a fallu du chemin parce que ce problème émergeait et que peu de gens travaillaient dessus ».
Aux données en tableaux, il préfère les données organisées en graphes, avec des rondeurs et des liens lesquels permettent d’organiser beaucoup mieux l’information, notamment sur le web. Au-delà des termes, il travaille aussi à formaliser les concepts pour mieux les structurer et les appréhender et qu’elles soient comprises par les machines.

Vers des systèmes plus intelligents, Open-SILEX et les autres

Et concrètement me direz-vous ? A partir de 2004, plusieurs projets de systèmes d’information sont développés dans l’unité Mistea. L’année suivante, ils se concrétisent avec Open-SILEX - Système d’Information pour l’expérimentation, un outil numérique libre sans équivalent qui propose des méthodes et des outils pour la collecte, la structuration et la valorisation de données d’origine agricole et environnementale. Le but est d’avoir des données partagées et réutilisables pour de futures recherches ou d’autres finalités, et pour cela il faut pouvoir les décrire, les contextualiser, les annoter, les lier, dans le respect des standards - on parle de données FAIR, faciles à trouver, accessibles, interopérables et réutilisables. Depuis, plusieurs systèmes d'information ont bénéficié des méthodologies et des développements mis au point. Parmi eux, ALFIS, dédié à l'étude de la fermentation alcoolique ; PHIS, consacré au phénotypage végétal ou encore SILEX-LBE, destiné à la gestion des données et au suivi en ligne de procédés de digestion biologique à partir d'effluents liquides ou de déchets solides. La renommée d’Open-SILEX a dépassé les frontières. Il est désormais prêt pour pouvoir proposer des prestations de service sur mesure et sur catalogue. La demande est également forte pour être formé et disposer de l’outil.

Mon travail, c’est la collaboration

Les partenariats se développent et les projets fleurissent. Pascal s’investit aussi beaucoup au service du collectif. Il ne compte plus les heures de formation et d’enseignement qu’il a dispensées. Il se voit également confier les clés de l’unité Mistea qu’il dirige depuis 2014. Une tâche qu’il remplit avec plaisir, porté par le souci constant de faire progresser les équipes qui l’entourent, mais qui n’est pas toujours de tout repos « Avant d’être DU, je faisais de la musique » dit-il en souriant !

L’important, c’est le collectif qui est derrière

Au fil des ans, Pascal Neveu a gagné en notoriété.

S’il est heureux aujourd’hui de recevoir le Laurier Innovation scientifique 2019 de l'Inra, il le dédie à son équipe et à ses collaborateurs sans qui rien n’aurait été possible.

photo de groupe Pascal Neveu
Le prix « Innovation pour la recherche » distinguera le parcours de Pascal Neveu. Ingénieur de recherche virtuose du Big Data, il est directeur d’unité dans le centre Inra Occitanie-Montpellier depuis 2014

Et après ?
Demain, Pascal Neveu y a déjà longuement réfléchi, épris qu’il est de formalisme. A moyen terme, il n’envisage pas moins de trois perspectives : d’abord, rendre OpenSilex plus facilement accessible aux communautés scientifiques ou aux entreprises privées ; ensuite, mettre du raisonnement dans les connaissances ; enfin, traiter les données avec plus de discernement et d’individualité. Trois enjeux majeurs auxquels il travaille déjà avec ses équipes, à la croisée des défis sociétaux et économiques portés par l’agriculture de précision et l’Institut Convergences #DigiTag.
En savoir plus

Neveu P. et al. 2018.Dealing with multi-source and multi-scale information in plant phenomics: the PHIS open-source Information. System. New Phytologist 221: 588.

Aceves-Lara C.A. et al. 2018. The virtual food system: Innovative models and experiential feedback in technologies for winemaking, the cereals chain, food packaging and eco-designed starter production. Innovative Food Science & Emerging Technologies 46: 54.

Muljarto A.R. et al. 2017. A generic ontological network for Agri-food experiment integration – Application to viticulture and winemaking. Computers and Electronics in Agriculture 140: 433.

Symeonidou D. et al. Key Discovery for Numerical Data: Application to Oenological Practices · pp. 222-236. In Graph-Based Representation and Reasoning - 23rd International Conference on Conceptual Structures, ICCS 2018, Edinburgh, UK, June 20-22, 2018, Proceedings. Chapman P., Endres D. & Pernelle N. (Eds.). Springer International Publishing AG, part of Springer Nature.

Pradal C. et al. 2017. InfraPhenoGrid: A scientific workflow infrastructure for plant phenomics on the Grid. Future Generation Computer System 67: 341.

Catherine Foucaud-Scheunemann Rédactrice

Le centre

Le département