3 results on '"Data Provisioning Service Lakes"'
Search Results
2. Intégration de données basée sur la qualité pour l'enrichissement des sources de données locales dans le Service Lake
- Author
-
Alili, Hiba, Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (LAMSADE), Université Paris Dauphine-PSL, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS), Université Paris sciences et lettres, École Nationale des Sciences de l'Informatique (La Manouba, Tunisie), Daniela Grigori, and Henda Hadjami Ben Ghezala
- Subjects
User Preferences ,Data Services ,Annotation Sémantique ,Service Composition ,Ingénierie Dirigée par les Modèles ,Schema Enriching ,User-Centric Data Integration ,Quality of Service (QoS) ,Nuage de données ,Services de données ,Data as a Service (DaaS) ,Semantic Annotation ,Composition des services ,Qualité des services ,Data Quality ,Intégration de données centrée utilisateur ,[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB] ,Lacs de services ,Cloud Computing ,Qualité de données ,Données en tant que Service ,Data Provisioning Service Lakes ,Model Driven Engineering ,Service views ,Enrichissement deSchémas ,Préférences utilisateur - Abstract
In the Big Data era, companies are moving away from traditional data-warehouse solutions whereby expensive and timeconsumingETL (Extract, Transform, Load) processes are used, towards data lakes in order to manage their increasinglygrowing data. Yet the stored knowledge in companies’ databases, even though in the constructed data lakes, can never becomplete and up-to-date, because of the continuous production of data. Local data sources often need to be augmentedand enriched with information coming from external data sources. Unfortunately, the data enrichment process is one of themanual labors undertaken by experts who enrich data by adding information based on their expertise or select relevantdata sources to complete missing information. Such work can be tedious, expensive and time-consuming, making itvery promising for automation. We present in this work an active user-centric data integration approach to automaticallyenrich local data sources, in which the missing information is leveraged on the fly from web sources using data services.Accordingly, our approach enables users to query for information about concepts that are not defined in the data sourceschema. In doing so, we take into consideration a set of user preferences such as the cost threshold and the responsetime necessary to compute the desired answers, while ensuring a good quality of the obtained results.; De nos jours, d’énormes volumes de données sont créés en continu et les utilisateurs s’attendent à ce que ceux-ci soient collectés, stockés et traités quasiment en temps réel. Ainsi, les lacs de données sont devenus une solution attractive par rapport aux entrepôts de données classiques coûteux et fastidieux (nécessitant une démarche ETL), pour les entreprises qui souhaitent stocker leurs données. Malgré leurs volumes, les données stockées dans les lacs de données des entreprises sont souvent incomplètes voire non mises à jour vis-à-vis des besoins (requêtes) des utilisateurs.Les sources de données locales ont donc besoin d’être enrichies. Par ailleurs, la diversité et l’expansion du nombre de sources d’information disponibles sur le web a rendu possible l’extraction des données en temps réel. Ainsi, afin de permettre d’accéder et de récupérer l’information de manière simple et interopérable, les sources de données sont de plus en plus intégrées dans les services Web. Il s’agit plus précisément des services de données, y compris les services DaaS du Cloud Computing. L’enrichissement manuel des sources locales implique plusieurs tâches fastidieuses telles que l’identification des services pertinents, l’extraction et l’intégration de données hétérogènes, la définition des mappings service-source, etc. Dans un tel contexte, nous proposons une nouvelle approche d’intégration de données centrée utilisateur. Le but principal est d’enrichir les sources de données locales avec des données extraites à partir du web via les services de données. Cela permettrait de satisfaire les requêtes des utilisateurs tout en respectant leurs préférences en terme de coût d’exécution et de temps de réponse et en garantissant la qualité des résultats obtenus.
- Published
- 2019
3. On Enriching User-Centered Data Integration Schemas in Service Lakes
- Author
-
Rim Drira, Khalid Belhajjame, Hiba Alili, Henda Ben Ghezala, Daniela Grigori, Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (LAMSADE), Université Paris Dauphine-PSL, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS), Laboratoire de recherche en Génie Logiciel, Applications distribuées, Systèmes décisionnels et Imagerie intelligente [Manouba] (RIADI), École Nationale des Sciences de l'Informatique [Manouba] (ENSI), and Université de la Manouba [Tunisie] (UMA)-Université de la Manouba [Tunisie] (UMA)
- Subjects
Service (systems architecture) ,Data provisioning service lakes ,business.industry ,Computer science ,Big data ,Context (language use) ,02 engineering and technology ,computer.software_genre ,World Wide Web ,User-centric data integration ,020204 information systems ,0202 electrical engineering, electronic engineering, information engineering ,Position (finance) ,020201 artificial intelligence & image processing ,[INFO]Computer Science [cs] ,Raw data ,business ,computer ,Data integration ,Schema enriching - Abstract
In the Big Data era, companies are moving away from traditional data-warehouse solutions whereby expensive and time-consuming ETL (Extract-Transform-Load) processes are used, towards data lakes, which can be viewed as storage repositories holding a vast amount of raw data. In this paper, we position ourselves in the recurrent context where a user has a local dataset that is not sufficient for processing the queries that are of interest to him. In this context, we show how the data lake, or more specifically the service lake since we are focusing on data providing services, can be leveraged to enrich the local dataset with concepts that cater for the processing of user queries. Furthermore, we present the algorithms we have developed for this purpose and showcase the working of our solution using a study case.
- Published
- 2017
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.