You are here

Interface de modélisation graphique pour l’étude des modèles complexes de dépendance dans les données biologiques de grandes dimensions

Project Type: 
origine

L’étape suivante de notre travail consiste à créer un point de liaison unique et inventif entre la biologie et les statistiques, car il est évident que les recherches génomiques et statistiques doivent aller de pair, chacune fournissant des renseignements à l’autre selon des principes rigoureux, avec le but commun d’obtenir les réponses les plus proches de la vérité objective que chacune ne pourrait trouver seule.

Project Leader(s): 

Dr. Laurent Briollais, Université de Toronto

Les modèles graphiques sont l’un des outils statistiques les plus efficaces utilisés des 20 dernières années dans l’analyse des données de grandes dimensions à structure complexe. Ils offrent une structure probabilistique permettant de tirer des conclusions et de représenter les connaissances que nous avons sur ces données à structure complexe. Dans le domaine de la recherche biologique, plus particulièrement, dans les nouvelles disciplines « -omique », telles que la génomique, la protéomique, la métabolomique ou la transcriptomique, les données sont souvent générées à partir d’expériences complexes à haute capacité et de plans expérimentaux complexes. Les modèles graphiques peuvent représenter ces problèmes biologiques compliqués, en donnant des algorithmes de calcul relativement simples et souples qui permettent d’obtenir les quantités recherchées. Le graphique d’un modèle consiste en un ensemble de sommets et en un ensemble d’arêtes reliant certains des sommets. Dans le cadre des études sur la biologie, les sommets représentent des variables comme les niveaux d’expression des ARN messagers (ARNm), les taux de protéines, les conditions environnementales, les génotypes et les phénotypes. Les arêtes décrivent les relations entre ces variables et peuvent être interprétées au moyen de la sémantique biologique typique (ce qu’on appelle en bio-informatique « annotation »). Malgré l’explosion des modèles statistiques complexes dans les domaines de la génétique et de la bio-informatique, un écart important demeure encore entre la théorie et ses applications. Les échanges entre les communautés appliquées et méthodologiques demeurent étonnamment limités. Il s’agit d’un problème courant dans le domaine de la recherche « -omique », où les systèmes biologiques fortement structurés sont malheureusement très difficiles à saisir d’un seul angle. Notre groupe de chercheurs a développé une expertise unique dans les sciences statistiques et biologiques.

L’étape suivante de notre travail consiste à créer un point de liaison unique et inventif entre la biologie et les statistiques, car il est évident que les recherches génomiques et statistiques doivent aller de pair, chacune fournissant des renseignements à l’autre selon des principes rigoureux, avec le but commun d’obtenir les réponses les plus proches de la vérité objective que chacune ne pourrait trouver seule. Il importe que les méthodes élaborées visent à tirer les conclusions qui intéressent les biologistes et qu’elles soient rigoureuses sur les plans mathématique et statistique.

Nous démontrerons la pertinence de notre approche par le biais de plusieurs applications qui pourraient avoir des incidences majeures dans les domaines de la biologie et de la santé publique :

  • découverte des gènes des maladies humaines complexes à l’aide des études sur l’association pangénomique ;
  • conclusions tirées relativement aux systèmes biologiques complexes au moyen des données des disciplines « -omiques » ;
  • modèles de prévisions des maladies humaines complexes.

Enfin, notre objectif fondamental consiste à élaborer des outils de prévision pour une médecine personnalisée dans une variété de contextes cliniques au moyen d’expériences « -omiques » à haute capacité.

Project team: 
Dr. Gary Bader, University of Toronto
Dr. Adrian Dobra, University of Washington
Dr. Hélène Massam, York University
Dr. Hilmi Ozcelik, Samuel Lunenfeld Research Institute
Funding period: 
1 avril 2009 - 31 mars 2011