Société et territoires 3 min
Vers une recherche reproductible en sciences humaines et sociales
Les recherches en sciences humaines et sociales traitent de nombreuses données, demandent du temps et des méthodes adaptées. Afin de pouvoir reproduire et répliquer leurs résultats, des ingénieures et ingénieurs issus de six laboratoires INRAE du Département de recherche Economie et Sciences Sociales (EcoSocio) dont la Toulouse School of Economics – Research (TSE-R), ont formalisé et partagé une méthodologie de reproductibilité.
Publié le 29 octobre 2021
Les recherches empiriques en sciences humaines et sociales nécessitent la manipulation de nombreuses données, de multiples programmes pour leur gestion, leur analyse statistique, les estimations économétriques, les simulations…
« Maitriser l’ensemble des étapes d’un projet de recherche est indispensable pour pouvoir reproduire ou répliquer les résultats à long terme », explique Valérie Orozco, ingénieure au laboratoire INRAE TSE-R. « De plus, cette rigueur est exigée par notre profession comme par les éditeurs de revues scientifiques et les financeurs des projets de recherche ».
Cette rigueur débouche sur une recherche reproductible, qui assure que l’ensemble des traitements et analyses réalisés depuis les données brutes jusqu’à la publication finale sont traçables et reproductibles. Elle amène une transparence dans les recherches, assurant fiabilité et confiance dans les résultats publiés.
Une méthodologie partagée
« Cet enjeu de reproductibilité de toutes les recherches, a largement été appuyé par le Département EcoSocio d’INRAE. En effet, ce département a encouragé, dès 2010, la constitution de groupes de travail, composé d’ingénieurs, pour préconiser des bonnes pratiques en gestion des données et reproductibilité des traitements au sein des recherches », retrace Valérie Orozco.
Un premier groupe de travail mobilisé a présenté en 2012 une charte et un guide des bonnes pratiques autour de la qualité de la gestion et de la préparation des données. Un second collectif de huit ingénieurs issus de six laboratoires INRAE du département EcoSocio a travaillé, depuis 2013, sur la reproductibilité des résultats et publié un article en 2020. Par la mise en commun de leurs pratiques et expériences, ils ont proposé trois principes pour améliorer la qualité et la fiabilité des recherches et ainsi les rendre reproductibles, donc réutilisables. Ces bonnes pratiques ont été réfléchies autour des fonctionnalités des logiciels les plus utilisés en économie.
Le premier principe porte sur l’organisation des étapes du projet et leur documentation. Des outils peuvent aider les chercheurs à avoir une organisation plus structurée de la documentation des différentes tâches d’un projet. Des pratiques assez simples sont proposées pour organiser les dossiers et suivre les flux de travail, comme le partage des fichiers, la gestion des versions et l’écriture collaborative.
Le deuxième principe concerne l’écriture de programmes compréhensibles. Il faut veiller à ce que les codes écrits puissent être lus par d’autres ou retravaillés ultérieurement. Pour ce faire, il est intéressant d’adopter des conventions de mise en forme et de dénomination des variables. Le code doit être modularisé pour être clair, lisible et réutilisable.
Le troisième principe porte sur la nécessité de l’automatisation des étapes au sein des recherches. Et ce, afin d’éviter tout traitement manuel et de réduire les erreurs. Cela permet également d’augmenter la reproductibilité des résultats depuis les données originelles.
Le partage de ces bonnes pratiques de transparence et de reproductibilité se poursuit par le biais d’interventions lors de séminaires, y compris dans les réseaux métiers. En parallèle, une veille est assurée sur l’évolution des outils.
« Nous restons bien sûr actifs sur ce sujet en lien avec les débats actuels autour de l’Open Science et de la démarche FAIR (Findable, Accessible, Interoperable, Reusable) », conclut Valérie Orozco.
Toulouse School of Economics - Research (TSE-R)
Observatoire du Développement Rural (ODR)
Centre d’Economie et de Sociologie appliquées à l’Agriculture et aux Espaces Ruraux (CESAER)
Centre d’Economie de l’Environnement – Montpellier (CEE-M)
Laboratoire d’Economie Appliquée de Grenoble (GAEL)
Structures et Marchés Agricoles, Ressources et Territoires-Laboratoire d’Etudes et de Recherche en ECOnomie (SMART LERECO)
Orozco, V., Bontemps, C., Maigné, E., Piguet, V., Hofstetter, A., Lacroix, A., Levert, F. and Rousselle, J.M. (2020), How To Make A Pie: Reproducible Research for Empirical Economics and Econometrics . Journal of Economic Surveys, 34: 1134-1169.
https://doi.org/10.1111/joes.12389