Back to Search
Start Over
Les bases de données graphes pour la science des données : implantation d'entrepôts des données et prédiction d'interactions protéine-protéine
- Source :
- Base de données [cs.DB]. Université de Strasbourg; Université de Sfax (Tunisie), 2022. Français. ⟨NNT : 2022STRAD042⟩
- Publication Year :
- 2022
- Publisher :
- HAL CCSD, 2022.
-
Abstract
- With the rise of big data, the use of data science has become critically important to extract insights from a huge amount of data. In recent years, several categories of databases have been used in data science to efficiently store, manage and analyze huge amounts of data. In particular, NoSQL (Not Only SQL) databases have emerged as an alternative to relational databases. In this thesis, we are interested in the graph-oriented category of NoSQL databases that replaces expensive relational joins with graph traversals. We use graph databases to address two data science issues of concern that are our main contributions: Implementing data warehouses capable of responding quickly to complex analytical queries and constructing descriptors to be used to predict missing values on the edges of a protein-protein interaction network.; Avec l’essor du big data, le recours à la science des données est devenu crucial pour extraire les connaissances à partir des données massives. Ces dernières années, plusieurs catégories de bases de données ont été utilisées en science des données pour stocker, gérer et analyser efficacement les mégadonnées. En particulier, les bases de données NoSQL (Not Only SQL) ont émergé comme une alternative aux bases de données relationnelles. Dans cette thèse, nous nous intéressons à la catégorie orientée graphes des bases de données NoSQL qui remplace les jointures relationnelles coûteuses par des parcours du graphe. Nous les utilisons pour répondre à deux problématiques en science des données et qui constituent nos principales contributions : implanter des entrepôts de données capables de répondre rapidement à des requêtes analytiques complexes et construire des descripteurs afin de les utiliser pour prédire les valeurs manquantes sur les arcs d’un réseau d’interaction protéine-protéine.
- Subjects :
- Graph databases
Entrepôts de données
[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB]
Data warehouses
Interaction protéine-protéine
Feature construction
Bases de données graphes
Construction de descripteurs
Base de données relationnelles
Protein-protein Interaction
Relational databases
Subjects
Details
- Language :
- French
- Database :
- OpenAIRE
- Journal :
- Base de données [cs.DB]. Université de Strasbourg; Université de Sfax (Tunisie), 2022. Français. ⟨NNT : 2022STRAD042⟩
- Accession number :
- edsair.od.......165..892cea84adb2ea28125997ef95dbfbc7