Back to Search Start Over

Les bases de données graphes pour la science des données : implantation d'entrepôts des données et prédiction d'interactions protéine-protéine

Authors :
Akid, Hajer
Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (ICube)
École Nationale du Génie de l'Eau et de l'Environnement de Strasbourg (ENGEES)-Université de Strasbourg (UNISTRA)-Institut National des Sciences Appliquées - Strasbourg (INSA Strasbourg)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Les Hôpitaux Universitaires de Strasbourg (HUS)-Centre National de la Recherche Scientifique (CNRS)-Matériaux et Nanosciences Grand-Est (MNGE)
Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Réseau nanophotonique et optique
Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS)
Université de Strasbourg
Université de Sfax (Tunisie)
Nicolas Lachiche
Mounir Ben Ayed
Source :
Base de données [cs.DB]. Université de Strasbourg; Université de Sfax (Tunisie), 2022. Français. ⟨NNT : 2022STRAD042⟩
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

With the rise of big data, the use of data science has become critically important to extract insights from a huge amount of data. In recent years, several categories of databases have been used in data science to efficiently store, manage and analyze huge amounts of data. In particular, NoSQL (Not Only SQL) databases have emerged as an alternative to relational databases. In this thesis, we are interested in the graph-oriented category of NoSQL databases that replaces expensive relational joins with graph traversals. We use graph databases to address two data science issues of concern that are our main contributions: Implementing data warehouses capable of responding quickly to complex analytical queries and constructing descriptors to be used to predict missing values on the edges of a protein-protein interaction network.; Avec l’essor du big data, le recours à la science des données est devenu crucial pour extraire les connaissances à partir des données massives. Ces dernières années, plusieurs catégories de bases de données ont été utilisées en science des données pour stocker, gérer et analyser efficacement les mégadonnées. En particulier, les bases de données NoSQL (Not Only SQL) ont émergé comme une alternative aux bases de données relationnelles. Dans cette thèse, nous nous intéressons à la catégorie orientée graphes des bases de données NoSQL qui remplace les jointures relationnelles coûteuses par des parcours du graphe. Nous les utilisons pour répondre à deux problématiques en science des données et qui constituent nos principales contributions : implanter des entrepôts de données capables de répondre rapidement à des requêtes analytiques complexes et construire des descripteurs afin de les utiliser pour prédire les valeurs manquantes sur les arcs d’un réseau d’interaction protéine-protéine.

Details

Language :
French
Database :
OpenAIRE
Journal :
Base de données [cs.DB]. Université de Strasbourg; Université de Sfax (Tunisie), 2022. Français. ⟨NNT : 2022STRAD042⟩
Accession number :
edsair.od.......165..892cea84adb2ea28125997ef95dbfbc7