13 results on '"Proveniência de dados"'
Search Results
2. BlockFlow: uma arquitetura baseada em Blockchain para confiança em Workflows científicos colaborativos apoiados por uma plataforma de ecossistema de software
- Author
-
Raiane Querino Coelho, Villela, Regina Maria Maciel Braga, David, José Maria Nazar, Dantas, Mário Antônio Ribeiro, and Classe, Tadeu Moreira de
- Subjects
Ecossistema de software científico ,Scientific software ecosystem ,Reprodutibilidade ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Reliability ,Collaborative scientific experiments ,Reproducibility ,Blockchain ,Computação em nuvem ,Proveniência de dados ,Confiabilidade ,Provenance ,Experimentos científicos colaborativos ,Cloud computing - Abstract
Atualmente, os experimentos científicos são realizados de forma colaborativa. Na colaboração científica, o compartilhamento de dados, a troca de ideias e resultados são essenciais para promover o conhecimento e acelerar o desenvolvimento da ciência. Nesse sentido, com atividades cada vez mais complexas, os workflows científicos estão se tornando mais intensivos em dados, exigindo ambientes colaborativos, distribuídos e de alto desempenho (HPC), como grades ou nuvens, para sua execução. Esses ambientes em nuvem estão se tornando cada vez mais adotados por cientistas, pois fornecem escalabilidade e provisionamento de recursos sob demanda. Por outro lado, em experimentos científicos colaborativos baseados em dados, a interoperabilidade, a privacidade e a confiança devem ser consideradas. Para isso, dados de proveniência tem sido amplamente reconhecido por fornecer um histórico das etapas da realização de experimentos científicos, auxiliando na reprodutibilidade dos resultados. Além disso, uma das tecnologias que podem melhorar a colaboração, rastreabilidade e confiança nos resultados científicos, com o objetivo de reprodutibilidade, é blockchain. Nesse sentido, este trabalho propõe uma arquitetura baseada em blockchain, proveniência e infraestrutura em nuvem para trazer confiança na execução de experimentos científicos colaborativos. A arquitetura permite que os pesquisadores criem ambientes distribuídos e confiáveis para a experimentação científica colaborativa, apoiando a coleta e análise de dados de workflows científicos. A solução oferece um ambiente distribuído, que privilegia a interoperabilidade, a privacidade e a confiança em dados de fontes heterogêneas, para permitir a reprodutibilidade dos resultados obtidos na experimentação científica colaborativa. Currently, scientific experiments are carried out collaboratively. In scientific collaboration, data sharing, the exchange of ideas and results are essential to promote knowledge and accelerate the development of science. In this sense, with increasingly complex activities, scientific workflows are becoming more data-intensive, requiring collaborative, distributed, and high-performance environments (HPC), such as grids or clouds, for its execution. Cloud environments are becoming increasingly adopted by scientists as they provide scalability and provisioning of resources on demand. On the other hand, in collaborative scientific experiments based on data, interoperability, privacy, and trust must be considered. For this, provenance has been widely recognized to provide a history of the steps taken in carrying out scientific experiments, assisting in the reproducibility of scientific results. In addition, one of the technologies that can improve collaboration, traceability, and confidence in scientific results, with the objective of reproducibility, is Blockchain. In this vein, this work proposes an architecture based on blockchain, provenance, and cloud infrastructure to bring confidence in the execution of collaborative scientific experiments. The architecture allows researchers to create distributed and reliable environments for collaborative scientific experimentation, supporting the collection and analysis of data from scientific workflows. The solution provides a distributed environment, which privileges interoperability, privacy, and trust in data from heterogeneous sources, to allow the reproducibility of the results obtained in collaborative scientific experimentation
- Published
- 2021
3. Metadatos y el modelo prov: perspectivas de los datos de procedencia en contextos digitales
- Author
-
Arakaki, Felipe Augusto
- Subjects
Metadata ,Proveniência de dados ,Data provenance ,Informação e tecnologia ,Technology and information ,Metadatos ,Metadados ,Catalogación ,Cataloging ,Procedencia de los datos ,Catalogação ,Información y tecnología - Abstract
Introduction: Understanding the data is one of the requirements to ensure the confidence of the information provided, besides enabling audits based on the information of those who made it available and when it was published. However, the persistence of the data and the use of the model and the PROV scheme benefit in promoting the reuse of the data, because once these are reliable, they can be used and reused. Objective: The objective of this work is to present the PROV document family of the World Wide Web Consortium (W3C) as an alternative for the representation of provenance in digital contexts. Methodology: It is characterized by a qualitative and exploratory research on provenance in digital contexts, through a bibliographic investigation. The research section covers studies published internationally and in Brazil, in the portuguese, spanish and english. Results: A brief discussion about the provenance in digital environments is presented. Subsequently, the W3C recommendations on provenance. Conclusions: Based on the significant aspects for the structuring of provenance in the digital context, these data are considered essential to ensure the reliability of the information described, besides enabling the understanding of the context in which the data were made available and, also, its reuse. Introducción: Comprender los datos es uno de los requisitos para garantizar la confianza de la información proporcionada, además de permitir auditorías basadas en la información de quienes los puso a disposición y cuándo se publicaron. En este sentido, la persistencia de los datos y el uso del modelo y el esquema PROV ayudan a promover la reutilización de los datos, ya que una vez que estos son fiables se pueden utilizar y reutilizar. Objetivo: En vista de este escenario, el objetivo de este trabajo es presentar la familia de documentos PROV del World Wide Web Consortium (W3C) como una alternativa para la representación de la procedencia en contextos digitales. Metodología: Se caracteriza por una investigación cualitativa y exploratoria sobre procedencia en contextos digitales, a través de una investigación bibliográfica. La sección de investigación abarca estudios publicados internacionalmente y en Brasil, en portugués, español e inglés. Resultados: Se presenta una breve discusión sobre la procedencia en entornos digitales. Posteriormente, las recomendaciones del W3C sobre procedencia. Conclusiones: Sobre la base de los aspectos significativos para la estructuración de la procedencia en el contexto digital, estos datos se consideran esenciales para garantizar la fiabilidad de la información descrita, además de permitir la comprensión del contexto en el que se ponen a disposición los datos y, también, su reutilización. Introdução: A compreensão dos dados é um dos requisitos para garantir a confiança das informações prestadas, além de possibilitar auditorias a partir das informações de quem as disponibilizou e quando foram publicadas. Nesse sentido, a persistência dos dados e o uso do modelo e do esquema PROV auxiliam na promoção do reuso dos dados, pois uma vez que estes são confiáveis podem ser utilizados e reutilizados. Objetivo: Diante deste cenário, o objetivo deste trabalho é apresentar a família de documentos PROV do World Wide Web Consortium (W3C) como alternativa para a representação da proveniência em contextos digitais. Metodologia: Caracteriza-se por uma pesquisa qualitativa e exploratória sobre proveniência em contextos digitais, por meio de uma investigação bibliográfica. O recorte da pesquisa abrange estudos publicados internacionalmente e no Brasil, nos idiomas em português, em espanhol e em inglês. Resultados: É apresentada uma breve discussão a respeito da proveniência em ambientes digitais. Posteriormente, as recomendações do W3C sobre a proveniência. Conclusões: A partir dos aspectos significativos para a estruturação da proveniência no contexto digital, esses dados são tidos como essenciais para garantir a confiabilidade das informações descritas, além de possibilitar a compreensão do contexto em que os dados foram disponibilizados e, ainda, o seu reuso.
- Published
- 2020
4. Metadatos y el modelo PROV : perspectivas de los datos de procedencia en contextos digitales
- Author
-
Felipe Augusto Arakaki
- Subjects
Proveniência de dados ,Tecnologia ,metadados. catalogação. proveniência de dados. informação e tecnologia ,Metadados ,General Medicine ,Informação ,Catalogação ,lcsh:Z ,lcsh:Bibliography. Library science. Information resources - Abstract
Introdução: A compreensão dos dados é um dos requisitos para garantir a confiança das informações prestadas, além de possibilitar auditorias a partir das informações de quem as disponibilizou e quando foram publicadas. Nesse sentido, a persistência dos dados e o uso do modelo e do esquema PROV auxiliam na promoção do reuso dos dados, pois uma vez que estes são confiáveis podem ser utilizados e reutilizados. Objetivo: Diante deste cenário, o objetivo deste trabalho é apresentar a família de documentos PROV do World Wide Web Consortium (W3C) como alternativa para a representação da proveniência em contextos digitais. Metodologia: Caracteriza-se por uma pesquisa qualitativa e exploratória sobre proveniência em contextos digitais, por meio de uma investigação bibliográfica. O recorte da pesquisa abrange estudos publicados internacionalmente e no Brasil, nos idiomas em português, em espanhol e em inglês. Resultados: É apresentada uma breve discussão a respeito da proveniência em ambientes digitais. Posteriormente, as recomendações do W3C sobre a proveniência. Conclusões: A partir dos aspectos significativos para a estruturação da proveniência no contexto digital, esses dados são tidos como essenciais para garantir a confiabilidade das informações descritas, além de possibilitar a compreensão do contexto em que os dados foram disponibilizados e, ainda, o seu reuso. Introduction: Understanding the data is one of the requirements to ensure the confidence of the information provided, besides enabling audits based on the information of those who made it available and when it was published. However, the persistence of the data and the use of the model and the PROV scheme benefit in promoting the reuse of the data, because once these are reliable, they can be used and reused. Objective: The objective of this work is to present the PROV document family of the World Wide Web Consortium (W3C) as an alternative for the representation of provenance in digital contexts. Methodology: It is characterized by a qualitative and exploratory research on provenance in digital contexts, through a bibliographic investigation. The research section covers studies published internationally and in Brazil, in the portuguese, spanish and english. Results: A brief discussion about the provenance in digital environments is presented. Subsequently, the W3C recommendations on provenance. Conclusions: Based on the significant aspects for the structuring of provenance in the digital context, these data are considered essential to ensure the reliability of the information described, besides enabling the understanding of the context in which the data were made available and, also, its reuse. Introducción: Comprender los datos es uno de los requisitos para garantizar la confianza de la información proporcionada, además de permitir auditorías basadas en la información de quienes los puso a disposición y cuándo se publicaron. En este sentido, la persistencia de los datos y el uso del modelo y el esquema PROV ayudan a promover la reutilización de los datos, ya que una vez que estos son fiables se pueden utilizar y reutilizar. Objetivo: En vista de este escenario, el objetivo de este trabajo es presentar la familia de documentos PROV del World Wide Web Consortium (W3C) como una alternativa para la representación de la procedencia en contextos digitales. Metodología: Se caracteriza por una investigación cualitativa y exploratoria sobre procedencia en contextos digitales, a través de una investigación bibliográfica. La sección de investigación abarca estudios publicados internacionalmente y en Brasil, en portugués, español e inglés. Resultados: Se presenta una breve discusión sobre la procedencia en entornos digitales. Posteriormente, las recomendaciones del W3C sobre procedencia. Conclusiones: Sobre la base de los aspectos significativos para la estructuración de la procedencia en el contexto digital, estos datos se consideran esenciales para garantizar la fiabilidad de la información descrita, además de permitir la comprensión del contexto en el que se ponen a disposición los datos y, también, su reutilización.
- Published
- 2020
- Full Text
- View/download PDF
5. Melhoria de processos de software através da combinação de proveniência de dados, ontologias, redes complexas e visualizações
- Author
-
Falci, Maria Luiza Furtuozo, Braga, Regina Maria Maciel, Dantas, Mário Antônio Ribeiro, and Oliveira, Daniel Cardoso Moraes de
- Subjects
Proveniência de dados ,Ontology ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Processos de software ,Data provenance ,Software processes ,Rede complexa ,Tomada de decisão ,Ontologia ,Complex network ,Decision making - Abstract
O processo de desenvolvimento de software é uma atividade complexa, que é influenciada por diferentes fatores, e pode ser surpreendida por um comportamento inesperado do software. Devido a sua importância cada vez maior nos dias de hoje, a necessidade de melhoria na qualidade do software e seus processos é de extrema importância. Uma forma de melhorar processos de software é através da análise de dados de execuções anteriores, dados estes que para serem coletados necessitam do controle e monitoramento dos processos. O presente trabalho propõe uma arquitetura que engloba modelos de proveniência de dados, ontologia e rede complexa, para modelar a proveniência na área de processos de desenvolvimento software, além de permitir a extração de conhecimento implícito nos dados. A arquitetura conta também com uma camada de visualização para dar suporte à compreensão do comportamento dos dados a gerentes de projetos, e dessa forma os mesmos possam tomar decisões orientadas a dados e melhorar futuras execuções. A arquitetura proposta foi avaliada através da utilização de dados reais e estudo com participação de um gerente de projetos. Software development process is a complex activity, which is influenced by many factors and can be surprised by an unexpected software behavior. Software‟s importance has grown exponentially in the past few years, which makes software improvement extremely necessary, as it is present in many different aspects of daily life. Analyze data from previous executions may be a good tactic to deal with software unpredictability, and to record processes‟ data is necessary to implement software monitoring and control. The present work proposes an architecture that encompasses provenance data, ontology and complex network models to structure data provenance in software process‟ domain and allow implicit knowledge extraction. The architecture proposed has a visualization layer to support project managers‟ data comprehension, allowing them to have data-oriented decision making and improve future process executions. The proposed architecture was evaluated with real companies‟ data and through a study with a specialist participation.
- Published
- 2018
6. Apoiando o reúso em uma plataforma de ecossistema de software científico através do gerenciamento de contexto e de proveniência
- Author
-
Ambrósio, Lenita Martins, David, José Maria Nazar, Braga, Regina Maria Maciel, Arbex, Wagner Antônio, Santos, Neide dos, and Amorim, Fernanda Araújo Baião
- Subjects
Proveniência de dados ,Elementos de contexto ,Experimentos científicos ,E-Science ,Scientific workflows ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Data provenance ,Reúso ,Contextual elements ,Reuse ,Scientific experiments ,Workflows científicos - Abstract
Considerando o cenário de experimentação científica atual e o crescente uso de aplicações em larga escala, o gerenciamento de dados de experimentação está se tornando cada vez mais complexo. O processo de experimentação científica requer suporte para atividades colaborativas e distribuídas. O gerenciamento de informações contextuais e de proveniência desempenha um papel fundamental no domínio neste domínio. O registro detalhado das etapas para produzir resultados, bem como as informações contextuais do ambiente de experimentação, pode permitir que os cientistas reutilizem esses resultados em experimentos futuros e reutilizem o experimento ou partes dele em outro contexto. O objetivo deste trabalho é apresentar uma abordagem de gerenciamento de informações de proveniência e contexto que apoie pesquisadores no reúso de conhecimento sobre experimentos científicos conduzidos em uma plataforma colaborativa e distribuída. Primeiramente, as fases do ciclo de vida do gerenciamento de contexto e proveniência foram analisadas, considerando os modelos existentes. Em seguida, foi proposto um framework conceitual para apoiar a análise de elementos contextuais e dados de proveniência de experimentos científicos. Uma ontologia capaz de extrair conhecimento implícito neste domínio foi especificada. Essa abordagem foi implementada em uma plataforma de ecossistema científico. Uma avaliação realizada por meio de estudos de caso evidenciou que essa arquitetura é capaz de auxiliar os pesquisadores durante a reutilização e reprodução de experimentos científicos. Elementos de contexto e proveniência de dados, associados a mecanismos de inferência, podem ser utilizados para apoiar a reutilização no processo de experimentação científica. Considering the current experimentation scenario and the increasing use of large-scale applications, the experiment data management is growing complex. The scientific experimentation process requires support for collaborative and distributed activities. Managing contextual and provenance information plays a key role in the scientific domain. Detailed logging of the steps to produce results, as well as the environment context information could allow scientists to reuse these results in future experiments and reuse the experiment or parts of it in another context. The goal of this work is to present a provenance and context metadata management approach that support researchers in the reuse of knowledge about scientific experiments conducted in a collaborative and distributed platform. First, the context and provenance management life cycle phases were analyzed, considering existing models. Then it was proposed a conceptual framework to support the analysis of contextual elements and provenance data of scientific experiments. An ontology capable of extracting implicit knowledge in this domain was specified. This approach was implemented in a scientific ecosystem platform. An evaluation conducted through case studies shown evidences that this architecture is able to help researchers during the reuse and reproduction of scientific experiments. Context elements and data provenance, associated with inference mechanisms, can be used to support the reuse in scientific experimentation process.
- Published
- 2018
7. Captura de proveniência assíncrona em simulações computacionais
- Author
-
Leite, Luciano Silva, Oliveira, Daniel Cardoso Moraes de, Pires, Paulo de Figueiredo, and Mattoso, Marta Lima de Queirós
- Subjects
Proveniência de dados ,Simulação computacional ,ENGENHARIAS [CNPQ] - Abstract
Submitted by Daniele Fonseca (daniele@ct.ufrj.br) on 2020-08-25T14:16:17Z No. of bitstreams: 1 LucianoSilvaLeite-min.pdf: 717340 bytes, checksum: 76079153fbf1c58edfa20556c36468ea (MD5) Made available in DSpace on 2020-08-25T14:16:17Z (GMT). No. of bitstreams: 1 LucianoSilvaLeite-min.pdf: 717340 bytes, checksum: 76079153fbf1c58edfa20556c36468ea (MD5) Previous issue date: 2018-09 Simulações computacionais em larga escala são experimentos computacionais cada vez com mais processamento de dados. Usuários e desenvolvedores deste tipo de simulação geralmente realizam análises sobre dados científicos durante a execução da simulação. Esta não é uma tarefa trivial, já que as simulações em larga escala costumam ser executadas em ambientes de processamento de alto desempenho e produzir grande volume de dados. Soluções existentes, como o DfAnalyzer, fazem uso de dados de proveniência para auxiliar esta análise com muito sucesso. No entanto, esses sistemas possuem abordagens síncronas de coleta de dados, o que dificulta a sua instalação e, principalmente, interfere no desempenho da simulação computacional. Esta dissertação propõe uma abordagem assíncrona de coleta de dados de proveniência com o objetivo de disponibilizar dados científicos para consulta durante a execução da simulação sem muito impacto no seu tempo de execução. Para validar as estratégias propostas, foi desenvolvida a ferramenta Asynchronous Dataflow Analyzer. A implementação realizada estende o DfAnalyzer para adotar o assincronismo proposto e simplifica a configuração do sistema por meio da flexibilização da gerência da proveniência prospectiva. Os resultados experimentais, com uma simulação de processos de sedimentação de solos, mostram que a ferramenta é capaz de atender as necessidades de análises de dados dos usuários de simulações computacionais com sobrecargas inferiores a ferramentas existentes. Large-scale computational simulations are computational experiments increasingly more processing intensive. Users and developers of this type of simulation generally analyze data during simulation execution. This is not a trivial task since largescale simulations are often performed in high-performance processing environments and can produce a large volume of data. Existing solutions, as DfAnalyzer, use provenance data to assist analysis with success. However, these systems use synchronous approaches to gather data that makes difficult to set up it and, mainly, interferes in the performance of the computational simulation. This dissertation proposes an approach to asynchronously collect provenance data making it available for analysis during the execution of the simulation with the least possible delay. In order to evaluate the proposed strategies, a tool, Asynchronous Dataflow Analyzer. This implementation extends DfAnalyzer to use the proposed asynchronous approach and to simplify the configuration process by making the prospective provenance definition process more flexible. The experimental results, with a soils sedimentation simulation, show that the tool is able to meet the needs of users of large-scale computational simulations with lower overloads than similar tools.
- Published
- 2018
8. Uma infraestrutura para apoiar o processo de teste de software através de proveniência e previsão dos resultados de testes de unidade
- Author
-
Paiva, Camila Acácio de, Araújo, Marco Antônio Pereira, David, José Maria Nazar, and Werneck, Vera Maria Benjamim
- Subjects
Proveniência de dados ,Continuous software engineering ,Testes de regressão ,Data provenance ,Algoritmos de previsão ,CIENCIAS EXATAS E DA TERRA [CNPQ] ,Engenharia de software contínua ,Prediction algorithms ,Regression tests - Abstract
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior O software está cada vez mais presente no cotidiano das pessoas. Vários setores ou aspectos do ambiente são influenciados por ele. Desta forma, o desenvolvimento de software torna-se uma atividade crítica. Assim, o processo de teste se torna crucialmente importante, pois qualquer negligência pode refletir na qualidade do produto. Contudo, o cenário de desenvolvimento de software vem sofrendo mudanças a partir da necessidade de suprir demandas com maior agilidade e as exigências do mercado. É fundamental haver uma visão holística dos processos de desenvolvimento do software com o objetivo de gerar um ciclo de melhoria contínua. Tal visão é denominada como Engenharia de Software Contínua. A Engenharia de Software Contínua é caracterizada pelo uso do feedback de execuções para alcançar uma melhoria contínua e pela realização das atividades de maneira contínua. Feedback esse que pode ser fornecido através da proveniência de dados: descrição das origens de um dado e os processos pelos quais passou. Diante disso, este trabalho apresenta uma infraestrutura que tem como foco a captura e o armazenamento do histórico dos dados de execução do projeto, a previsão dos resultados dos testes de unidade através de algoritmos de previsão Logistic Regression, Naive Bayes e C4.5 Algorithm, e a disponibilização dos dados para aplicações externas. Além disso, oferece elementos de visualização que auxiliam na compreensão dos dados. Um experimento com dados de um projeto real foi realizado com o intuito de identificar a acurácia das previsões. Software is increasingly present in people's daily lives. Various sectors and the environment are influenced by them. In this way, the development of software becomes a critical activity. Thus, the testing process becomes crucially important because any negligence can affect the quality of the product and the insecurity related to the use of the software. However, the software development scenario has undergone changes from the need to meet demands with greater agility and the demands of the market. It is fundamental to have a holistic view of the software development processes in order to generate a cycle of continuous improvement. Such a view is referred to as Continuous Software Engineering. Continuous Software Engineering is characterized by the use of feedback from executions to achieve continuous improvement and by performing activities on an ongoing basis. Feedback this can be provided through the provenance of data: description of the origins of a given and the processes by which it passed. This work presents an infrastructure that focuses on the capture and storage of the project execution data history, the prediction of the results of the unit tests through prediction algorithms: Logistic Regression, Naive Bayes and C4.5 Algorithm, and the provision of data for external applications. It also provides preview elements which help in understanding the data. An experiment with data from a real project was carried out in order to identify the accuracy of the prediction.
- Published
- 2018
9. Um framework para análise e visualização de dados de proveniência
- Author
-
Oliveira, Weiner Esmério Batista de, Braga, Regina Maria Maciel, Menezes, Victor Stroële de Andrade, and Dantas, Mario Antônio Ribeiro
- Subjects
Redes complexas ,Proveniência de dados ,Software visualization ,Provenance data ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Complex networks ,Visualização de software - Abstract
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior A proveniência é reconhecida hoje como um desafio central para estabelecer confiabilidade e prover segurança em sistemas computacionais. Em workflows científicos, a proveniência é considerada essencial para apoiar a reprodutibilidade dos experimentos, a interpretação dos resultados e o diagnóstico de problemas. Estes benefícios podem também ser utilizados em outros contextos, como, por exemplo, em processos de software. No entanto, para sua melhor compreensão e utilização, são necessários mecanismos eficientes e amigáveis. Pesquisas em visualização de software, ontologias e redes complexas podem ajudar neste processo, gerando novo conhecimento sobre os dados e informações estratégicas para tomada de decisão. Esta dissertação apresenta um framework chamado Visionary, para auxiliar na compreensão e uso dos dados de proveniência através de técnicas de visualização de software, ontologias e análise de redes complexas. O framework captura os dados de proveniência e gera novas informações usando ontologias e análise do grafo de proveniência. A visualização apresenta e destaca as inferências e os resultados obtidos com a análise. O Visionary é um framework livre de contexto que pode ser adaptado para qualquer sistema que utiliza o modelo PROV de proveniência. Com o objetivo de avaliar a proposta, foi realizado um estudo experimental que encontrou indícios que o framework auxilia na compreensão e análise dos dados de proveniência, dando suporte à tomada de decisão. Provenance is recognized today as a central challenge to establish reliability and pro-vide security in computational systems. In scientific workflows, provenance is considered essential to support the reproducibility of experiments, interpretation of results and diagnosis of problems. We consider that these benefits can be used in new contexts, like software process. However, for a better understanding and use, efficient and friendly mechanisms are needed. Software visualization, ontology, and complex networks can help in this process by generating new data insights and strategic information for decision making. This dissertation presents a framework named Visionary, to assist in the understanding and use of provenance data through software visualization techniques, ontologies and analysis of complex networks. The framework captures the provenance data and generates new information using ontologies and analysis of provenance graph. The visualization presents and highlights the inferences and the results obtained with the analysis. Visionary is a context-free framework that can be adapted to any system that uses the PROV provenance model. In order to evaluate the proposal, an experimental study was carried out, which found indications that the framework assists in the understanding and analysis of provenance data, supporting decision making.
- Published
- 2017
10. Apoiando a composição de serviços em um ecossistema de software científico
- Author
-
Marques, Phillipe Israel, David, José Maria Nazar, Braga, Regina Maria Maciel, and Santos, Rodrigo Pereira dos
- Subjects
Provenance data ,Composição de Serviços Web ,Interoperabilidade ,e-Science ,Services reuse ,Interoperability ,Scientific social networks ,Redes sociais científicas ,Software ecosystem ,Proveniência de dados ,Web Services Composition ,Reutilização ,CIENCIAS EXATAS E DA TERRA [CNPQ] ,Ecossistema de software - Abstract
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior A área de e-Science envolve a realização de experimentos científicos complexos, normalmente apoiados por workflows. Esses experimentos geralmente utilizam dados e recursos distribuídos, e podem ser apoiados por uma plataforma de ecossistema de software científico. Neste contexto, é necessário permitir que diferentes serviços web possam ser compostos, reutilizados, além de interoperarem na plataforma para tratar das complexidades dos experimentos. Entretanto, compor serviços em plataformas de ecossistemas é uma atividade complexa, considerando, sobretudo, os requisitos funcionais e não funcionais desses serviços. Diante disso, o objetivo deste trabalho é apresentar um mecanismo que busca apoiar a composição de serviços no contexto de um ecossistema de software científico. Para tanto, esse mecanismo é associado ao processo de criação de serviços da plataforma de ecossistema de software científico. Oferece elementos de visualização para representar os relacionamentos de dependência funcional e interoperabilidade entre os serviços. Além disso, utiliza a análise de redes sociais científicas para identificar potenciais colaboradores. Os pesquisadores identificados poderão interagir com o auxílio das visualizações existentes, no espaço de trabalho compartilhado, para avaliar as composições. Essa plataforma, denominada E-SECO, apoia as diferentes fases do ciclo de vida de um experimento científico. A partir desse mecanismo, cientistas interagem e analisam as relações entre serviços nas composições realizadas considerando, sobretudo, as métricas de dependência funcional e a interoperabilidade entre os serviços existentes em diferentes instâncias da plataforma. Visando avaliar o mecanismo para apoiar a composição de serviços, foram realizados estudos de caso na plataforma E-SECO. The area of e-Science encompasses performing complex scientific experiments, usually supported by workflows. These experiments generally use distributed data and resources, and can be supported by a scientific software ecosystem platform. In this context, it is necessary to allow different web services to be composed, reused, and interoperate in the platform to deal with the complexities of the experiments. However, performing services composition on ecosystem platform is a complex activity which requires computational support, considering, above all, the functional and non-functional requirements of these services. Therefore, the goal of this work is to present a mechanism that aims to support services composition in scientific software ecosystem context. To this end, this mechanism is associated to the service construction process of the scientific software ecosystem platform. It also provides visualization elements to represent functional dependency and interoperability relationships between the services. In addition, it uses scientific social networks analysis to identify potential collaborators. The identified researchers may interact through the visualizations, in the shared workspace, to evaluate the compositions. This platform, named E-SECO, supports different phases of the scientific experiment life cycles. From this mechanism, scientists interact and analyze the relationships between services in compositions which were performed considering, above all, the functional dependency metrics and interoperability issues between existing services in different instances of the platform. In order to evaluate the mechanism to support services composition, case studies were carried out on the E-SECO platform.
- Published
- 2017
11. PROV-Process: proveniência de dados aplicada a processos de desenvolvimento de software
- Author
-
Dalpra, Humberto Luiz de Oliveira, Villela, Regina Maria Maciel Braga, Menezes, Victor Ströele de Andrade, Campos, Fernanda Cláudia Alves, and Gomes, Antônio Tadeu Azevedo
- Subjects
Proveniência de dados ,Provenance data ,Mineração de dados ,Ontology ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Data Mining ,Ontologia - Abstract
O processo de desenvolvimento de software pode ser definido como um conjunto de atividades, métodos, práticas e transformações utilizadas para desenvolver e manter o software e seus produtos associados. A descrição simplificada deste processo é denominada modelo de processo, no qual definem-se as atividades para o desenvolvimento do software, as especificações dos produtos de cada atividade e a indicação dos papéis das pessoas envolvidas. A execução destes processos gera dados importantes sobre o mesmo. A análise devida do histórico destes dados pode resultar na descoberta de informações importantes, as quais podem contribuir para o entendimento de todo o processo e, consequentemente, colaborar para a melhoria deste. A palavra proveniência refere-se a origem, fonte, procedência de um determinado objeto. Em termos computacionais, proveniência é um registro histórico da derivação dos dados que pode auxiliar no entendimento do dado e/ou registro atual. Este trabalho apresenta a proposta de uma arquitetura que, através do uso de modelos de proveniência de dados, aliado a um modelo ontológico e técnicas de mineração de dados, visa identificar melhorias nos processos de desenvolvimento de software e apresentá-las ao gerente de projetos por meio de uma ferramenta. Esta ferramenta, através da importação dos dados de execução de processos, alimenta um banco de dados relacional, modelado conforme a especificação de um modelo de proveniência de dados. Estes dados são carregados em um modelo de Ontologia e em um arquivo de mineração de dados. Assim, os dados são submetidos a uma máquina de inferência, no modelo ontológico, e também a análise de um algoritmo que integra regras de classificação e associação, na mineração de dados. O resultado desta análise apresenta indícios de pontos de melhorias no processo de desenvolvimento de software. A arquitetura proposta baseia-se em trabalhos relacionados, os quais foram selecionados a partir da execução de uma revisão sistemática. The software development process can be defined as a set of activities, methods, practices and transformations used to develop and maintain the software and its related products. A simplified description of this process is called process model, which defines the activities for the development of software, product specifications of each activity and the indication of the roles of the people involved. The implementation of these processes generates important data on it. The proper analysis of the history of this data may result in the discovery of important information, which can contribute to the understanding of the process and therefore contribute to its improvement. The word provenance refers to the origin or source a particular object. In computer terms, provenance is a historical record of the derivation of data that can assist in the understanding of the data and / or the current record. This dissertation presents a proposal for an architecture that, through the use of data source models, combined with an ontological model and data mining techniques, aims to identify improvements in software development processes and present them to the project manager. This tool, by importing the process execution data, feeds a relational database, modeled based on a provenance model. These data are loaded into an ontology model and into a data mining file. Upon this loading, the data are processed by an inference machine, considering the ontological model, and also by an algorithm that integrates classification and association rules in data mining. The result of this analysis can presents points to improvements in the software development process. The proposed architecture is based on related work, which selected from the execution of a systematic review.
- Published
- 2016
12. E-SECO ProVersion: uma arquitetura para manutenção e evolução de workflows científicos
- Author
-
Tassio Ferenzini Martins Sirqueira, Villela, Regina Maria Maciel Braga, Araújo, Marco Antônio Pereira, Oliveira, Alcione de Paiva, and David, Jose Maria Nazar
- Subjects
Proveniência de dados ,Evolução ,Maintenance ,Evolution ,Data Provenance ,CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO [CNPQ] ,Scientific Workflow ,Workflow científico ,Manutenção - Abstract
Um ecossistema de software científico, além de outras funcionalidades, busca integrar todas as etapas de um experimento, e comumente utiliza workflows científicos para a resolução de problemas complexos. Toda modificação ocorrida em um experimento deve ser propagada para os workflows associados, os quais devem ser mantidos e evoluídos para o prosseguimento com sucesso da pesquisa. Um das forma de garantir este controle é através da gerência de configuração. Para que ela possa ser utilizada, é importante o armazenamento dos dados de execução e modelagem do experimento e workflows associados. Neste trabalho, utilizamos conceitos e modelos relacionados à proveniência de dados para o armazenamento e consulta destes dados. O uso da proveniência de dados traz alguns benefícios neste armazenamento e consulta, conforme veremos nesta dissertação. Assim, nesse trabalho é proposta uma arquitetura para gerenciar a evolução e manutenção de experimentos e workflows científicos, denominada E-SECO ProVersion. A motivação para a especificação e implementação da arquitetura veio a partir da realização de uma revisão sistemática e de um estudo para verificar características de manutenção e evolução em repositórios de workflows existentes. A partir destas análises, as principais funcionalidades da arquitetura foram definidas e detalhadas. Além disso, um roteiro com diretrizes de uso e provas de conceito utilizando workflows extraídos do repositório myEx-periment foram apresentados, com o objetivo de avaliar a aplicabilidade da arquitetura. A scientific software ecosystem, in addition to other features, seeks to integrate all stages of an experiment, and commonly used scientific workflows to solve complex problems. Any changes that occurred in an experiment must be propagated to the associated workflows, which must be maintained and evolved for further successful research. One of the way to ensure this control is through configuration management. So that it can be used, it is important the storage of performance data and modeling of the experiment and associated workflows. In this study, we use the concepts and models related to the source of data for storage and retrieval of this data. Use the data source brings some advantages in storage and query, as we will see in this dissertation. Thus, this paper proposes an architecture to manage the development and maintenance of scientific experiments and workflows, called E-SECO ProVersion. The motivation for the specification and implementation of architecture came from the realization of a systematic review and a study to check maintenance characteristics and evolution in existing workflows repositories. From these analyzes, the main features of the architecture are defined and detailed. In addition, a roadmap with usage guidelines and proofs of concept using workflows extracted from myExperiment repository were presented in order to evaluate the applicability of architecture.
- Published
- 2016
13. SciProv: uma arquitetura para a busca semântica em metadados de proveniência no contexto de e-Science
- Author
-
Valente, Wander Antunes Gaspar, Villela, Regina Maria Maciel Braga, Azevedo, Leonardo Guerreiro, and Campos, Fernanda Cláudia Alves
- Subjects
Proveniência de dados ,Data Provenance ,E-Science ,Open Provenance Model ,Web semântica ,Scientific Workflow ,Workflow científico ,CIENCIAS EXATAS E DA TERRA [CNPQ] ,Semantic Web - Abstract
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior A e-Science se caracteriza pela manipulação de um vasto volume de dados e utilização de recursos computacionais em larga escala, muitas vezes localizados em ambientes distribuídos. Nesse cenário, representado por alta complexidade e heterogeneidade, torna-se relevante o tratamento da proveniência de dados, que tem por objetivo descrever os dados que foram gerados ao longo da execução de um experimento científico e apresentar os processos de transformação pelos quais foram submetidos. Assim, a proveniência auxilia a formar uma visão da qualidade, da validade e da atualidade dos dados produzidos em um ambiente de pesquisa científica. O SciProv consiste em uma arquitetura cujo objetivo é interagir com sistemas de gerenciamento de Workflows científicos para promover a captura e a gerência dos metadados de proveniência gerados. Para esse propósito, o SciProv adota uma abordagem baseada em um modelo abstrato para a representação da proveniência. Esse modelo, denominado Open Provenance Model, confere ao SciProv a capacidade de prover uma infraestrutura homogênea e interoperável para a manipulação dos metadados de proveniência. Como resultado, o SciProv permite disponibilizar um arcabouço para consulta às informações de proveniência geradas em um cenário complexo e diversificado de e-Science. Mais importante, a arquitetura faz uso de tecnologia web semântica para processar as consultas aos metadados de proveniência. Nesse contexto, a partir do emprego de ontologias e máquinas de inferências, o SciProv provê recursos para efetuar deduções sobre os metadados de proveniência e obter resultados importantes ao extrair informações adicionais além daquelas que encontram-se registradas de forma explícita nas informações gerenciadas. E-Science is characterized by manipulation of huge data set and large scale computing resources usage, often located in distributed environments. In this scenario, represented by high complexity and heterogeneity, it becomes important to treat data provenance, which aims to describe data that were generated during a scientific experiment execution and presents processes of transformation by which underwent. Thus, lineage helps to form a quality, validity and topicality vision of data produced in a scientific research environment. SciProv consists of an architecture that aims to interact with scientific workflows management systems for capture and manipulation of generated provenance metadata. For this purpose, SciProv adopts an approach based on an abstract model for representing the lineage. This model, called Open Provenance Model, provides to SciProv the ability to set up a homogeneous and interoperable infrastructure for handling provenance metadata. As a result, SciProv is able to provide a framework for query data provenance generated in a complex and diverse e-Science scenario. More important, the architecture makes use of semantic web technology to process metadata provenance queries. In this context, using ontologies and inference engines, SciProv provides resources to make inferences about lineage and to obtain important results in allowing the extraction of information beyond those that are registered explicitly from managed data.
- Published
- 2011
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.