Back to Search Start Over

Combining combinatorial optimization and statistics to mine high-throughput genotyping data

Authors :
Hamon, Julie
Dhaenens, Clarisse
Jacques, Julien
Even, Gaël
Parallel Cooperative Multi-criteria Optimization (DOLPHIN)
Laboratoire d'Informatique Fondamentale de Lille (LIFL)
Université de Lille, Sciences et Technologies-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lille, Sciences Humaines et Sociales-Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Sciences et Technologies-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lille, Sciences Humaines et Sociales-Centre National de la Recherche Scientifique (CNRS)-Inria Lille - Nord Europe
Institut National de Recherche en Informatique et en Automatique (Inria)
Université de Lille, Sciences et Technologies-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lille, Sciences Humaines et Sociales-Centre National de la Recherche Scientifique (CNRS)
Laboratoire Paul Painlevé (LPP)
Université de Lille-Centre National de la Recherche Scientifique (CNRS)
MOdel for Data Analysis and Learning (MODAL)
Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Sciences et Technologies-Inria Lille - Nord Europe
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Evaluation des technologies de santé et des pratiques médicales - ULR 2694 (METRICS)
Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-Université de Lille-Centre Hospitalier Régional Universitaire [Lille] (CHRU Lille)-École polytechnique universitaire de Lille (Polytech Lille)
Gènes Diffusion [Douai]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Hamon, Julie
Laboratoire Paul Painlevé - UMR 8524 (LPP)
Centre National de la Recherche Scientifique (CNRS)-Université de Lille
Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Université de Lille-Université de Lille, Sciences et Technologies-Inria Lille - Nord Europe
Source :
JOBIM-Journées Ouvertes Biologie Informatique Mathématiques, JOBIM-Journées Ouvertes Biologie Informatique Mathématiques, Jun 2011, Paris, France
Publication Year :
2011
Publisher :
HAL CCSD, 2011.

Abstract

National audience; Depuis quelques années, la génomique a grandement évolué avec le développement de nouvelles technologies telles que le séquençage et le génotypage haut-débit. En ce qui concerne le domaine animal, nous sommes aujourd'hui capables de lire les informations génomiques sur près de 800 000 marqueurs sur des ensembles d'individus de plus en plus larges (de 3 000 à 10 000). Ces données peuvent donner lieu à des études d'association entre les marqueurs (GWAS : Genome-Wide Association Studies). Outre les contraintes biologiques (stockage des échantillons, manipulations longues et coûteuses...), la partie analyse de données (étude et extraction de connaissances) doit aussi être adaptée en terme de méthodologie et d'architecture matérielle et logicielle. L'objectif est d'élaborer des modéles prédictifs permettant, à partir des données génomiques, de déterminer les individus les plus performants selon certains critères quantitatifs de sélection animale. Pour cela, l'objectif théorique est à terme de définir de nouvelles méthodes permettant la coopération entre statistique et optimisation combinatoire spécifiquement dédiées aux données issues de génotypage haut débit en vue d'une implémentation.

Details

Language :
French
Database :
OpenAIRE
Journal :
JOBIM-Journées Ouvertes Biologie Informatique Mathématiques, JOBIM-Journées Ouvertes Biologie Informatique Mathématiques, Jun 2011, Paris, France
Accession number :
edsair.dedup.wf.001..c4e499402f1f4e47e9ccfb5ae5ed77ee