3 min

ASTERICS, un outil pour explorer et intégrer ses données omiques

Faciliter l’analyse statistique et intégrative de données biologiques massives et complexes, tel est l’objectif de l’application ASTERICS issue du laboratoire Mathématiques et informatique appliquées Toulouse (MIAT) du centre Occitanie-Toulouse.

Publié le 25 avril 2024

illustration ASTERICS, un outil pour explorer et intégrer ses données omiques
© Camille Ferrari pour ASTERICS

Depuis le début du 21ème siècle, la recherche en biologie connait un changement radical de ses pratiques avec l'introduction de technologies visant à comprendre les mécanismes du vivant par l'acquisition massive de données. Ainsi, la génomique, la protéomique, la métabolomique et toutes ces nouvelles technologies dites "omiques" permettent d'aborder l'exploration du vivant en posant des questions à une échelle plus globale sur le fonctionnement moléculaire des organismes.

Néanmoins, l’évolution croissante de la quantité des données, hétérogènes et multi-niveaux, issues de ces technologies et de leur complexité engendre un manque de capacité d’analyse, notamment d’analyses complexes. ASTERICS vise à combler ce manque en rendant les biologistes ou non-statisticiens plus autonomes sur les analyses exploratoires et intégratives.

Mêlant différentes expertises, ce projet est le fruit d’un partenariat entre plusieurs acteurs :

  • le laboratoire MIAT pour l’expertise statistique et le développement métier ;
  • la plateforme Genotoul-Bioinfo pour le développement informatique ;
  • l’Institut de mathématiques de Toulouse et la plateforme Genotoul-Biostat pour leur expertise sur les méthodes d’intégration de données ;
  • l’entreprise Hyphen-Stat pour son expertise en développement d’outils pour l’analyse d’études cliniques.

Ils se sont notamment appuyés sur un cas d’usage du laboratoire Génétique et physiologie des systèmes d’élevage (GENPHYSE) en utilisant des données sur le développement fœtal en fin de gestation chez l'espèce porcine.

Un outil, plusieurs fonctionnalités

Disponible gratuitement en ligne, l’outil ASTERICS peut également être installé localement sur un ordinateur grâce au code source et outils fournis. Après la création d’un espace de travail, il est possible d’importer un ou plusieurs jeux de données sous forme de données tabulaires, et de réaliser leur édition (formatage, gestion des données manquantes, normalisation), leur exploration (statistique descriptive, carte thermique, cartes auto organisatrices…) et l’intégration de plusieurs jeux de données acquis sur les mêmes individus.

Différents types de données omiques peuvent être pris en charge et analysés de façon différente. Le flux d’analyses proposé n’est pas linéaire mais permet au contraire de réaliser différentes éditions et explorations, d’extraire des données de celles-ci pour réaliser des analyses plus complexes, tout en gardant la trace des opérations effectuées via un graphique interactif qui permet de revenir sur les analyses.Afin d’accompagner les utilisateurs, un accent particulier a été mis sur la documentation expliquant les choix des paramètres (pré-choisis pour la plupart des données) et l’interprétation des résultats. Des données de test et deux cas d’usage rédigés sont également accessibles.

L’application ASTERICS étant maintenant disponible pour des analyses, les scientifiques poursuivent son développement sur 2 aspects : l’intégration de nouvelles analyses, selon les remontées des besoins des utilisateurs, et l’interopérabilité avec d’autres outils. Par exemple, il est envisagé de pouvoir directement importer des données produites par des plateformes de données, sans passer par le format tabulaire, ce qui permettrait aux biologistes de garder la trace des échantillons et manipulations effectuées dans une étude, en liant l’acquisition des données et leur analyse.

Référence :

Maigné, É., Noirot, C., Henry, J. et al. Asterics: a simple tool for the ExploRation and Integration of omiCS data. BMC Bioinformatics 24, 391 (2023). https://doi.org/10.1186/s12859-023-05504-9

En savoir plus

Agroécologie

L’intelligence artificielle au service de la sélection génétique des animaux d’élevage

Deux laboratoires du centre INRAE Occitanie-Toulouse, Génétique et physiologie des systèmes d’élevage (Genphyse - INRAE/INP ENSAT/ENVT) et Mathématiques et informatique appliquées Toulouse (MIAT - INRAE), ont mis au point un projet interdisciplinaire original associant intelligence artificielle et génétique moléculaire pour prédire l’impact des variabilités génétiques.

03 janvier 2024

Agroécologie

Vers des porcelets plus robustes à la naissance !

Afin d’améliorer la survie des porcelets à la naissance, une équipe de Génétique et Physiologie des Systèmes d’Elevage (Genphyse) et de Mathématiques et Informatique Appliquées Toulouse (MIAT) d’INRAE Occitanie-Toulouse a hiérarchisé et modélisé l’importance des gènes impliqués dans les processus biologiques clés du développement musculaire de cette espèce. Ces travaux interdisciplinaires ont fait l’objet d’une publication dans la revue Scientific Reports.

13 février 2020

Bioéconomie

Deep learning : du sudoku au design de protéines

Des scientifiques des laboratoires Mathématiques et informatique appliquées Toulouse (MIAT) et Toulouse biotechnology institute (TBI) du centre INRAE Occitanie-Toulouse ont développé une méthode hybride d’apprentissage par intelligence artificielle (IA) pour résoudre des casse-têtes difficiles et ainsi concevoir de nouvelles protéines.

27 juin 2023