Back to Search Start Over

SciProv: uma arquitetura para a busca semântica em metadados de proveniência no contexto de e-Science

Authors :
Valente, Wander Antunes Gaspar
Villela, Regina Maria Maciel Braga
Azevedo, Leonardo Guerreiro
Campos, Fernanda Cláudia Alves
Source :
Repositório Institucional da UFJF, Universidade Federal de Juiz de Fora (UFJF), instacron:UFJF
Publication Year :
2011
Publisher :
Universidade Federal de Juiz de Fora (UFJF), 2011.

Abstract

CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior A e-Science se caracteriza pela manipulação de um vasto volume de dados e utilização de recursos computacionais em larga escala, muitas vezes localizados em ambientes distribuídos. Nesse cenário, representado por alta complexidade e heterogeneidade, torna-se relevante o tratamento da proveniência de dados, que tem por objetivo descrever os dados que foram gerados ao longo da execução de um experimento científico e apresentar os processos de transformação pelos quais foram submetidos. Assim, a proveniência auxilia a formar uma visão da qualidade, da validade e da atualidade dos dados produzidos em um ambiente de pesquisa científica. O SciProv consiste em uma arquitetura cujo objetivo é interagir com sistemas de gerenciamento de Workflows científicos para promover a captura e a gerência dos metadados de proveniência gerados. Para esse propósito, o SciProv adota uma abordagem baseada em um modelo abstrato para a representação da proveniência. Esse modelo, denominado Open Provenance Model, confere ao SciProv a capacidade de prover uma infraestrutura homogênea e interoperável para a manipulação dos metadados de proveniência. Como resultado, o SciProv permite disponibilizar um arcabouço para consulta às informações de proveniência geradas em um cenário complexo e diversificado de e-Science. Mais importante, a arquitetura faz uso de tecnologia web semântica para processar as consultas aos metadados de proveniência. Nesse contexto, a partir do emprego de ontologias e máquinas de inferências, o SciProv provê recursos para efetuar deduções sobre os metadados de proveniência e obter resultados importantes ao extrair informações adicionais além daquelas que encontram-se registradas de forma explícita nas informações gerenciadas. E-Science is characterized by manipulation of huge data set and large scale computing resources usage, often located in distributed environments. In this scenario, represented by high complexity and heterogeneity, it becomes important to treat data provenance, which aims to describe data that were generated during a scientific experiment execution and presents processes of transformation by which underwent. Thus, lineage helps to form a quality, validity and topicality vision of data produced in a scientific research environment. SciProv consists of an architecture that aims to interact with scientific workflows management systems for capture and manipulation of generated provenance metadata. For this purpose, SciProv adopts an approach based on an abstract model for representing the lineage. This model, called Open Provenance Model, provides to SciProv the ability to set up a homogeneous and interoperable infrastructure for handling provenance metadata. As a result, SciProv is able to provide a framework for query data provenance generated in a complex and diverse e-Science scenario. More important, the architecture makes use of semantic web technology to process metadata provenance queries. In this context, using ontologies and inference engines, SciProv provides resources to make inferences about lineage and to obtain important results in allowing the extraction of information beyond those that are registered explicitly from managed data.

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Repositório Institucional da UFJF, Universidade Federal de Juiz de Fora (UFJF), instacron:UFJF
Accession number :
edsair.od......3056..aaa7733738f92dc96af2afeee17355af