Descriptor: "informática" / Publisher: porto alegre - Searchworks@Jio Institute Digital Library Search Results

Your search keyword '"informática"' showing total 2,550 results

Start Over Descriptor "informática" Publisher porto alegre

2,550 results on '"informática"'

1. Detecção de linguagem tóxica aplicada a textos em português

Author: Bordini, Rafael Heitor and Bordini, Rafael Heitor
Abstract: As redes sociais têm revolucionado a forma como a sociedade se comunica, graças à sua natureza descentralizada que permite a interação entre os usuários. No entanto, as mensagens que circulam nas redes sociais podem conter expressões de opinião, mensagens de apoio e, mas também discurso de ódio. O discurso de ódio é um problema crescente na esfera digital, geralmente causado pela polarização de opiniões ou pela falsa sensação de impunidade. Os haters, usuários que disseminam o discurso de ódio, podem ser encontrados em uma variedade de tópicos, incluindo debates políticos, entretenimento, jogos online e ambientes corporativos. A área de Processamento de Linguagem Natural (PLN) pode contribuir com ferramentas para assegurar uma comunicação saudável e garantir os direitos dos usuários no mundo digital, agindo de forma rápida, padronizada e automatizada, evitando a necessidade de moderação manual deste tipo de conteúdo.Neste estudo, utilizamos técnicas avançadas de aprendizado de máquina e aprendizado profundo para desenvolver um sistema de detecção de linguagem tóxica em mensagens em Português. O conjunto de dados utilizado para o treinamento dos modelos é composto por 6.354 (com possibilidade de extensão para 13.538) comentários anotados manualmente por especialistas. Este conjunto de dados, disponibilizado como parte do trabalho, possui anotações para 5 tarefas de PLN, utilizando um esquema de anotação hierárquico com diferentes níveis de granularidade. Os resultados dos experimentos demonstram a utilidade desse conjunto de dados para o desenvolvimento de sistemas de PLN voltados para a detecção de linguagem tóxica em textos em Português., The advent of social media has transformed the way in which individuals and communities interact and communicate. However, the messages on social media may contain expressions of opinion, and support messages, but they can also hate speech. The proliferation of hate speech in the digital sphere has become an increasingly pressing issue, with polarized opinions and a sense of anonymity and impunity among users often serving as contributing factors. The haters, users who spread hate speech, can be found in a variety of topics, including political discussions, entertainment, gaming, and corporate environments. The Natural Language Processing (NLP) area can contribute with tools to ensure healthy communication and protect users’ rights online. NLP applications are efficient, standardized, and automated, eliminating the need for manual moderation of such content. In this study, we used advanced machine learning and deep learning techniques to develop a toxic language detection system in Portuguese messages. The dataset used for training the models consists of 6,354 (with the possibility of extending to 13,538) comments manually annotated by experts. This dataset, made available as part of the work, has annotations for 5 NLP tasks, using a hierarchical annotation scheme with different levels of granularity. The results of the experiments demonstrate the usefulness of this dataset for the development of NLP systems aimed at detecting toxic language in texts in Portuguese.
Published: 2023

2. Contribuições para escalabilidade em replicação máquina de estados

Author: Dotti, Fernando Luís and Dotti, Fernando Luís
Abstract: O uso crescente de serviços online tem gerado a necessidade de arquiteturas que ofereçam alta disponibilidade e desempenho. No contexto de alta disponibilidade, a técnica de Replicação Máquina de Estados (RME) é uma solução amplamente utilizada em diversos setores da computação, como computação em nuvem, sistemas de banco de dados, mecanismos de sincronização e comunicação confiável. O conceito de RME é simples: como todas as réplicas iniciam com um mesmo estado e executam comandos deterministicamente na mesma ordem, as mesmas mudanças de estado após a execução de cada comando são realizadas entre todas as réplicas do sistema, garantindo consistência forte. No entanto, esse mesmo modelo básico de funcionamento da RME limita o seu desempenho. Para aumentar a escalabilidade da técnica de RME foram propostas diferentes estratégias. Uma possível estratégia para obter ganhos com a técnica é através do melhor aproveitamento dos múltiplos núcleos de processamento comumente disponíveis em servidores modernos. Diferentes arquiteturas paralelas de RME foram formuladas com soluções que introduzem concorrência na ordenação e execução de comandos, considerando que requisições não conflitantes podem ser processadas em paralelo sem afetar a consistência forte. Protocolos de consenso generalizado trabalham com a mesma noção de conflito: comandos que não conflitam não necessitam de ordenação durante o consenso. Nesta primeira parte do trabalho propõe-se, o uso de informações de conflito provenientes do consenso generalizado para a subsequente execução paralela de comandos na RME. Esta proposta, ainda não encontrada na literatura, foi descrita, implementada e avaliada, mostrando ganhos de desempenho.Outra estratégia utilizada para aumentar a escalabilidade da técnica de RME é com o particionamento do estado, permitindo que partições trabalhem de forma independentes. Além da ordenação de comandos para cada partição, comandos multi-partição necessitam de ordenação entre as partições en, The increasing use of online services has created the need for architectures that offer high availability and performance. In the context of high availability, the technique of State Machine Replication (SMR) is one of the most widely used solutions in diferent áreas such as cloud computing, database systems, synchronization mechanisms, and reliable communication. The concept of SMR is simple: since all replicas start with the same state and execute commands deterministically in the same order, the same changes in the state after the execution of each command are applied across all replicas of the system, ensuring strong consistency. However, this functioning model of SMR limits its performance. To increase the scalability of the SMR technique, different strategies have been proposed. One possible strategy to gain benefits from the technique is through better utilization of processor cores commonly available in modern servers. Different parallel architectures for SMR have been formulated with solutions that introduce concurrency in the ordering and execution of commands, considering that non-conflicting requests can be processed in parallel without affecting strong consistency. Generalized consensus protocols work with the same notion of conflict: non-conflicting commands do not require ordering during consensus. In the first part of this thesis, we propose the use of conflict information from generalized consensus protocols to enable parallel execution of commands in SMR. This proposal, not yet found in the literature, has been described, implemented, and evaluated, showing performance gains. Another strategy used to increase the scalability of the SMR technique is through state partitioning, allowing partitions to work independently. In addition to command ordering for each partition, multi-partition commands require ordering between the involved partitions.In this context, atomic multicast is a fundamental abstraction as it captures reliability and ordering requi
Published: 2023

3. Easing the benchmarking of parallel stream processing on multi-cores

Author: Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, Schepke, Claudio, Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, and Schepke, Claudio
Abstract: No mundo de hoje impulsionado por dados e crescente expectativa por resultados imediatos, há uma demanda crescente por processamento de dados em tempo real/baixa latência. O processamento de stream é uma técnica que processa os dados à medida que eles se tornam disponíveis, permitindo o processamento de dados quase em tempo real. Para lidar com o processamento de grandes volumes de dados, aplicações de processamento de stream devem recorrer a técnicas de paralelismo para acelerar o processamento. Embora existam interfaces de programação paralela (IPPs) capazes de adicionar várias camadas de abstração, o paralelismo no processamento de stream ainda é uma tarefa difícil e que normalmente exige conhecimento especializado para atingir os níveis de desempenho desejados. Isso gera um grande esforço de pesquisa em direção à aumentar o desempenho do processamento paralelo de stream e tornar a programação paralela mais acessível. Tipicamente, benchmarks são usados para avaliar as IPPs e novas soluções nesse contexto. No entanto, existem várias limitações nos benchmarks existentes, incluindo a falta de benchmarks para algumas categorias de aplicações de processamento de stream, poucas ou nenhuma opção de parametrização, dificuldade em estender os benchmarks para outras IPPs, falta de métricas de desempenho adequadas, falta de preocupação com usabilidade, suporte apenas para linguagens baseadas na Java Virtual Machine (JVM), etc. Este trabalho propõe um framework chamado SPBench para criar benchmarks personalizados e avaliar o processamento paralelo de stream. Nosso principal objetivo é facilitar o processo de benchmarking no processamento de stream, incluindo a criação, compilação, execução, ajuste-fino e avaliação dos benchmarks.Portanto, esta tese de doutorado fornece as seguintes principais contribuições científicas: (I) Um framework que simplifica o benchmarking de aplicações de processamento de stream, fornecendo uma Application Programming Interface (API) e uma interfac, In today’s fast-changing data-driven world, there is increasing demand for realtime/low-latency data processing. Stream processing is a technique that envisages processing data as it becomes available, enabling near real-time data processing. Stream processing applications must resort to parallelism techniques to speed up processing and to cope with processing large volumes of data. Although there are parallel programming interfaces (PPIs) that add several abstraction layers, parallelism in stream processing is still a difficult task, usually demanding expert knowledge to achieve desired performance levels. This generates a lot of research effort toward boosting parallel stream processing performance and making parallel programming more accessible. Typically, benchmarks are used to evaluate the PPIs and new solutions in this context. However, there are a number of limitations in existing benchmarks, including not addressing some categories of stream processing applications, few or no parameterization options, difficulty extending the benchmarks to other PPIs, lack of appropriate performance metrics, poor usability, only targeting JVM-based languages, and others. This work proposes a framework called SPBench for creating custom benchmarks and evaluating parallel stream processing. Our main goal is to ease the benchmarking process in parallel stream processing, including the creation, building, execution, tuning, and evaluating of the benchmarks. Therefore, this doctoral dissertation provides the following main scientific contributions: (I) A framework that simplifies the benchmarking of stream processing applications, providing an API and a command-line interface to simplify, reuse code, customize, extend, and evaluate diferente aspects or properties regarding parallel stream processing.(II) A parallel C++ benchmark suite for stream processing that includes real-world applications and the most state-of-theart Parallel Programming Interfaces (PPIs) in this context. (I
Published: 2023

4. Discriminação algorítmica: diretrizes neuroético-hermenêuticas para proteção de dados neurais

Author: Silveira, Paulo Antônio Caliendo Velloso da, Sarlet, Gabrielle Bezerra Sales, Silveira, Paulo Antônio Caliendo Velloso da, and Sarlet, Gabrielle Bezerra Sales
Published: 2023

5. Impacts of parallel programming on limited-resource hardware

Author: Griebler, Dalvan Jair, Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, and Fernandes, Luiz Gustavo Leão
Abstract: Dispositivos de hardware com recursos limitados são mais acessíveis e energeticamente eficientes do que hardware de ponta. Apesar de seu tamanho reduzido, esses dispositivos estão cada vez mais complexos, muitos agora apresentando vários núcleos de processamento, aceleradores GPGPU e maior capacidade de RAM. Para aproveitar ao máximo sua capacidade computacional, os desenvolvedores de software devem explorar o paralelismo, mas isso adiciona uma camada extra de complexidade, pois eles devem lidar com as restrições computacionais e as demandas de desempenho. Portanto, escolher a estratégia de paralelismo apropriada e a interface de programação paralela é crucial para obter o melhor desempenho do hardware. Para enfrentar esse problema, foram definidos objetivos de pesquisa para orientar a pesquisa sobre as estratégias de paralelismo e interfaces de programação mais adequadas para hardware com recursos limitados em relação ao desempenho e consumo de energia. Foram realizados experimentos com 12 aplicações usando três dispositivos e sete interfaces de programação paralela. Esta tese apresentpu novas métricas, diferentes aplicações, várias interfaces de paralelismo e diferentes dispositivos de hardware. Foi desenvolvido um conjunto estruturado de objetivos de pesquisa para avaliar o paralelismo, fornecendo uma metodologia para organizar várias considerações de paralelismo. Em resumo, este estudo concluiu que a computação paralela é benéfica em hardware com recursos limitados. Além disso, interfaces de programação paralela de nível mais alto de abstração são opções viáveis. Os resultados em dispositivos e interfaces específicas indicaram que o paralelismo beneficia o hardware com recursos limitados, reduzindo o consumo total de energia em até 63,53% e a vazão em até 112,54%.Além disso, as diferenças de pico de energia são de até 24,98% entre as técnicas de programação. Outra indicação é que existem diferenças estimadas de complexidade de software entre as interfaces de pro, Limited resource hardware devices are more affordable and energy efficient than high-end hardware. Despite their reduced size, these devices are increasingly complex, with many now featuring multiple processing cores, GPGPU accelerators, and larger RAM capacity. To fully utilize their computational capacity, software developers must exploit parallelism, but this adds an extra layer of complexity because they must balance computational constraints and performance demands. Therefore, choosing the appropriate parallelism strategy and parallel programming interface is crucial to achieving the best hardware performance. To tackle this problem, we defined research objectives to guide our work in finding the most appropriate parallelism strategies and programming interfaces for limited-resource hardware regarding performance and energy consumption. We experimented with 12 applications using three devices and seven parallel programming interfaces. This thesis introduces new metrics, additional applications, various parallelism interfaces, and extra hardware devices. We developed a structured set of research objectives to evaluate parallelism, providing a methodology to organize many parallelism considerations. In summary, this study concludes that parallel computing is beneficial in limited-resource hardware, and higher-level of abstraction parallel programming interfaces are viable options. Our results on target architecture and specific parallelism models indicate that parallelism benefits limited-resource hardware, reducing total energy consumption by up to 63.53% and increasing throughput by up to 112.54%. Additionally, power peak differences are up to 24.98% between programming techniques. Another indication is that there are estimated software complexity differences between programming interfaces of up to 858.33%.Overall, this thesis contributes to understanding the impacts of parallel programming on limited-resource hardware and provides insights into optimizing para
Published: 2023

6. Simplifying self-adaptive distributed stream processing in C++

Author: Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, Fernandes, Luiz Gustavo Leão, and Griebler, Dalvan Jair
Abstract: Fontes de dados como sensores IoT, logs de usuários, monitoramento de sinais vitais e streaming de vídeo estão cada vez mais presentes na sociedade. Muitas vezes, essas fontes produzem uma massiva quantidade de dados que os sistemas de computação tradicionais têm dificuldade para lidar. O processamento de stream é uma abordagem computacional que consegue lidar com essas cargas de trabalho massivas, atendendo aos requisitos de baixa latência e alta vazão. No entanto, desenvolver um sistema de streaming é uma tarefa desafiadora. Soluções como o Apache Flink e Apache Storm fornecem diversas abstrações de programação para tolerância a falhas, escalonamento, protocolos de comunicação e muitos outros mecanismos que ajudam os programadores a implementar códigos paralelos e distribuídos. Essas ferramentas são principalmente escritas em linguagens de programação de alto nível como Java e Scala. No entanto, no domínio de computação de alto desempenho, os programadores têm poucas opções de abstração de programação de alto nível quando se trata de sistemas de computação distribuídos escritos em linguagens de sistema como C/C++. Consequentemente, esses programadores muitas vezes dependem de ferramentas de mais baixo nível como o MPI para implementar aplicações distribuídas. Além disso, com MPI é comum empregar-se um modelo de programação estática para implementar aplicações distribuídas, opondo-se ao processamento de stream que lida dinamicamente com cargas de trabalho irregulares que variam em conteúdo, formato, tamanho e taxa de entrada. Os sistemas de processamento de stream devem permitir reconfigurações para se auto-adaptarem a picos no fluxo de dados, desacelerações e problemas de balanceamento de carga.Este trabalho tem como objetivo abordar esses desafios investigando os aspectos de adaptabilidade de sistemas distribuídos de processamento de stream. Para isso, introduziu-se uma nova ferramenta em C++ chamada MPR (Message Passing Runtime), que simplifica a implementação d, Data sources such as IoT sensors, user activity logs, health surveillance, and video streaming are becoming ubiquitous worldwide. Often, these sources produce big amounts of raw data, which traditional computing systems based on a store-first and compute-later batch paradigm struggle to handle. Stream processing is an effective solution that can manage these massive workloads while meeting low-latency and highthroughput requirements. However, developing a streaming system from scratch is a challenging endeavor. Distributed stream processing systems (DSPS) like Apache Flink and Apache Storm already provide many abstractions for transparent fault-tolerance, scheduling, communication protocols, and many other mechanisms that assist programmers in writing distributed parallel code. These tools are mostly written in higher-level programming languages like Java and Scala. Nevertheless, C/C++ distributed computing systems are preferred for high-performance computing (HPC), but in this domain, programmers lack high-level programming abstraction options. Consequently, C++ programmers usually rely on low-level MPI for coordinating distributed applications. Also, when using MPI, programmers often employ a static programming model to write their distributed applications, opposite to stream processing which dynamically deals with irregular workloads that vary in content, format, size, and input rate. Streaming systems should allow reconfiguration to self-adapt in response to data flow spikes, slowdowns, and load-balancing issues. This work aims to address these challenges by investigating the adaptability aspects of distributed streaming systems. For that, we introduce a new C++ framework called MPR (Message Passing Runtime), which simplifies the implementation of distributed stream processing applications.The framework relies on MPI’s message-passing communication and implements many programming abstractions, including data transfer, serialization, load balancing, and back pres
Published: 2023

7. Improving parallel programming assessment: challenges, methods, and opportunities in coding productivity

Author: Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, Fernandes, Luiz Gustavo Leão, and Griebler, Dalvan Jair
Abstract: O desenvolvimento de aplicações paralelas não é uma tarefa fácil, pois os desenvolvedores devem lidar com várias questões como a implementação da sincronização de dados, a divisão do problema de computação entre as threads e a exploração da concorrência. Para facilitar essa tarefa, surgiram novas Interfaces de Programação Paralela (IPPs). Ao avaliar essas IPPs, a maioria dos estudos na área de programação paralela se concentra na avaliação do tempo de execução e desempenho dessas IPPs. Entretanto, a produtividade é um fator importante que, juntamente com a eficácia e a satisfação do usuário, são indicadores de usabilidade. A partir da avaliação da produtividade e da usabilidade, é possível continuar aumentando as abstrações do paralelismo e criar IPPs melhores e simples de usar sem comprometer o desempenho das aplicações. Logo, o principal objetivo dessa tese de doutorado é prover metodologias e técnicas para melhorar e suportar a avaliação da produtividade na área de programação paralela. Para atingir esse objetivo, inicialmente conduzimos uma revisão da literatura para descobrir como a usabilidade e produtividade tem sido avaliada na área de programação paralela. A partir dessa revisão identificamos que a fim de avaliar a produtividade na programação paralela, alguns pesquisadores estão realizando estudos envolvendo pessoas, geralmente desenvolvedores de aplicações, os quais demandam certo tempo para serem planejados e executados. Por outro lado, alguns pesquisadores têm se concentrado no uso de métricas de Engenharia de Software (por exemplo, CCN, COCOMO II e Halstead), as quais não foram projetadas para avaliar especificamente o desenvolvimento de aplicações paralelas.Em relação ao processo de experimentação, nessa tese de doutorado, apresentamos uma metodologia para orientar outros pesquisadores de programação paralela durante o planejamento, execução e análise dos resultados dos experimentos. Para validar essa metodologia, conduzimos experimentos com iniciante, Developing parallel applications is a challenging task because the developers must be able to deal with several issues, such as implementing data synchronization, dividing the computation problem among threads, and exploiting concurrency. New Parallel Programming Interfaces (PPIs) have emerged to facilitate this task. When evaluating these IPPs, most studies in the parallel programming area focus on assessing the execution time and performance of these IPPs. However, productivity is an important factor that, together with effectiveness and user satisfaction, are usability indicators. From evaluating productivity and usability, it is possible to continue to increase the abstractions of parallelism and create better and simple-to-use PPIs without compromising application performance. Therefore, the main goal of this Ph.D. thesis is to provide methodologies and techniques to improve and support productivity evaluation in parallel programming. To achieve this goal, we initially conducted a literature review to determine how usability and productivity have been evaluated in parallel programming. From this review, we identified that to assess productivity in parallel programming, some researchers are conducting studies with people, usually application developers, which require some time to be planned and executed. On the other hand, some researchers have focused on using Software Engineering metrics (for example, CCN, COCOMO II and Halstead), which were not designed to evaluate parallel application development specifically. Regarding the experimentation process, in this Ph.D. thesis, we presented a methodology to guide other parallel programming researchers during the planning, execution, and analysis of experiment results.We conducted experiments with beginners in parallel programming to validate this methodology by exploring parallelism in stream processing applications in multi-core environments and data parallelism in GPU architectures. Regarding coding metrics, we co
Published: 2023

8. Software framework of control systems on an MPSoCs platform

Author: Moraes, Fernando Gehm and Moraes, Fernando Gehm
Abstract: Com a crescente complexidade de sistemas robóticos, diversos aspectos de seu controle tornam-se desafiantes. O sensoriamento gera agregados de dados volumosos a coletar e processar; atuadores demandam a rápida manipulação de sinais, e controladores evoluem para usar algoritmos sofisticados. Tal progressão de demanda exige um aumento do poder de processamento. Novas tecnologias de processadores podem introduzir limites energéticos. Esses limites, implicam em reduzir que a totalidade de recursos intra-chip seja simultaneamente empregada no seu máximo de desempenho. Dada esta limitação física, alternativas são necessárias para aumentar o desempenho do hardware. Soluções apontam para o paralelismo e a computação heterogênea. Um sistema de computação heterogênea distribui dados, processamento e execução de programas em diferentes processadores. Esta Tese propõe aplicar sistemas de controle digital em sistemas de computação heterogênea e paralela para aumenta a eficiência do controle, permitindo adicionar múltiplas técnicas a este. Exemplos são a descentralização da arquitetura de controle, a auto adaptação do controlador, técnicas de tolerância à falhas e a gestão de energia. A Tese propõe um arcabouço de programação para implementar sistemas de controle sobre sistemas multiprocessados on-chip (MPSoCs). O arcabouço foi desenvolvido de forma genérica, visando servir a múltiplos artefatos robóticos. O estudo de caso de aplicação usado é um veículo aéreo não-tripulado quadrirrotor. Tal tipo de veículo possui uma dinâmica rápida e alta sensibilidade à falhas e demanda por gestão de energia e controladores poderosos. O arcabouço de software foi embarcado em um ambiente de simulação habilitado a simular tanto o MPSoC quanto o quadrirrotor.Um conjunto de experimentos valida a hipótese geral da tese. Eles testam itens como requisitos temporais, descentralização do controle, capacidade de realizar controles com baixo impacto no desempenho, tolerância à falhas e gestão de energia, With the increasing complexity of robotic systems, many aspects of their control system architecture also become more complex. Sensing produces huge data aggregates to collect and process; actuators demand rapid signal manipulation, and controllers evolve to include highly complex algorithms. This progression in processing demand requires computing power to keep up. However, new processor technologies introduce power limits. These limits, implies that the dissipation of energy inside the chip prevents all its resources from being used simultaneously at their maximum performance rate. With this physical limitation, a distinct method is needed to continue to increase hardware performance. One way to deal with such high processing demands is through the use of heterogeneous computing. A heterogeneous computing system distributes data, processing, and program execution across different processors. The basic idea of this thesis is that the application of a digital control system in a heterogeneous computing system increases the efficiency of the controller, while allowing multiple techniques to be added to the control. Examples are the decentralization of the control architecture, the self-adaptation of the controller, fault tolerance techniques and the energy management. This thesis actually proposes a software framework for the implementation of control systems in a multiprocessor embedded system (MPSoC). This framework was developed in a generic way to serve multiple robotic artifacts. The application case study employed herein is a quadrotor unmanned aerial vehicle. Such an example of robotic equipment is considered due to its fast dynamics, its sensitivity to faults and its high demand for energy management and powerful controllers. The software framework was embedded in a simulation environment capable of simulating both the processor and the quadrotor.Six sets of experiments validate the general hypothesis of the thesis. These experiments tested the time requireme
Published: 2023

9. Advances in imitation learning from observation

Author: Barros, Rodrigo Coelho and Barros, Rodrigo Coelho
Abstract: A Imitação por Observação, técnica computacional destinada ao ensino de agentes por meio da observação de demonstrações de especialistas, enfrenta desafios significativos como baixo desempenho, problemas com mínimos locais e exploração ineficaz do espaço de estados. Apesar das recentes abordagens empregarem dados não rotulados para decodificar informações de maneira auto-supervisionada, persistem os desafios a serem superados. Em resposta a tais desafios, a presente tese introduz quatro novos métodos destinados à imitação por observação. Ainda, apresenta um estudo aprofundado sobre a resiliência dos métodos de aprendizado por imitação, proporcionando uma melhor compreensão de seu desempenho e robustez em diversos contextos. As contribuições dos métodos propostos são evidenciadas pelos resultados positivos alcançados. Foi verificado que o uso de um mecanismo de amostragem pode aperfeiçoar os ciclos iterativos de aprendizado, tornandoos mais equilibrados. A inclusão de um mecanismo de exploração revelou potencial para exceder o desempenho de especialistas e estabelecer novos patamares na área. Além disso, o emprego de mecanismos de aprendizado por reforço e de aprendizado adversário mostrou-se capaz de gerar políticas mais eficientes, obtendo resultados significativos com menos amostras. As estratégias propostas melhoraram o desempenho e a eficiência dos atuais métodos, ao mesmo tempo que minimizam a complexidade da aquisição de dados de especialistas., Imitation from Observation, a computational technique that instructs agents by observing expert demonstrations, suffers from considerable hurdles such as sub-optimal performance, local minima issues, and ineffective state-space exploration. Although recent strategies leverage unlabeled data to decode information self-supervisedly, persistent challenges remain. This thesis presents four novel methods for imitation learning from observation in response to those challenges. Furthermore, a comprehensive study on the resilience of imitation learning methods is provided to enable a nuanced comprehension of their robustness and performance across various scenarios. The achieved positive outcomes substantiate the merits of the proposed methods. A sampling mechanism is shown to enhance iterative learning cycles, rendering them more balanced. Integrating an exploration mechanism shows potential to surpass expert performance, establishing state-of-the-art results in the field. Moreover, the employment of reinforcement and adversarial learning mechanisms demonstrate their ability to forge more efficient policies, accomplishing good results with fewer samples. The proposed strategies boost performance and efficiency while minimizing the complexity of acquiring expert data.
Published: 2023

10. An approach for designing and exploring customizable narrative data visualizations

Author: Silveira, Milene Selbach and Silveira, Milene Selbach
Abstract: A crescente quantidade e diversidade de dados têm desafiado os pesquisadores de visualização de dados. Um dos desafios é como apresentar esses dados aos usuários de forma clara e fácil em diferentes domínios . Nos últimos anos, as visualizações narrativas foram propostas como uma abordagem para apresentar os dados em um formato de história, a fim de facilitar a compreensão do usuário. Transformar dados em um formato compreensível por humanos exige que os designers selecionem técnicas de visualização e outros elementos visuais adequados à sua intenção comunicativa. Por outro lado, os usuários finais podem ter diferentes necessidades e preferências em relação a como os dados são apresentados ou organizados. Neste cenário, a Programação por Usuário Final pode ser considerada um tópico promissor a ser combinado com as pesquisas em visualizações narrativas para atender às necessidades dos usuários finais . Esta tese segue esse caminho, ao apresentar uma abordagem para auxiliar os designers de visualizações no planejamento de visualizações narrativas com recursos de customização com os quais os usuários podem realizar atividades de customização ao explorá-las. Para construção desta abordagem, foram realizados estudos, incluindo revisões sistemáticas, grupos de foco, e sessões de brainstorm, a fim de investigar a exploração, customização e definição de elementos narrativos, além de estudos com usuários sobre o planejamento e exploração de narrativas customizáveis. Como principais resultados, reportam-se as análises de como a abordagem proposta apoiou os designers no planejamento das narrativas e de como os recursos de customização ajudaram os usuários finais a explorar as narrativas.Pelos estudos realizados, a abordagem foi considerada útil e pode auxiliar os designers de visualizações tanto na identificação dos elementos narrativos a partir dos dados quanto na definição de como os usuários finais podem customizar uma visualização narrativa., The increasing quantity and diversity of data have challenged data visualization researchers. One of the biggest challenges that emerged is how to present data to users clearly and easily in different domains of applications. In recent years, narrative data visualizations were proposed to present the data in a story-like form that may improve the user’s understanding. Transform data in a human-comprehensible format requires designers to select visualization techniques and other visual elements suitable to their communicative intention. On the other hand, the end-users of visualizations may have varying needs and preferences in how data is presented or organized. In this scenario, End-User Development is a promising topic to be blended into narrative data visualization research to address end-users’ needs. This thesis follows this path and presents na approach to assist visualization designers in planning narrative data visualizations with customization features with which users can perform customization activities to explore the narrative. We carried out studies, including systematic reviews, focus groups, and brainstorming sessions, to investigate the exploration, customization, and definition of narrative elements, and based on these studies, we outlined an approach. After defining it, we conducted user studies focusing on planning and exploring customizable narratives. As main results, we report the analysis of how the proposed approach aided designers in planning the narratives and results related to how customization features aided end-users in exploring the narratives.The approach was considered useful and can assist the visualization designers properly both in identifying the significant narrative elements from data and defining how the end-users can customize a narrative visualization.
Published: 2023

11. Benchmark TPC-C aplicado em replicação máquina de estados

Author: Dotti, Fernando Luís and Dotti, Fernando Luís
Abstract: A disponibilidade de um sistema pode ser afetada por falhas ou ataques que exploram suas vulnerabilidades. Atualmente, cada vez mais pessoas confiam em sistemas online disponiveis na Internet. Para minimizar os riscos de indisponibilidade, a Replicacao de Maquina de Estados (RME) e uma abordagem comum. A RME e uma estrategia importante para fornecer servicos de alta disponibilidade. Porem, o aumento da vazao em sistemas RME e desafiador devido ao seu modelo deterministico, o que demanda esforcos de pesquisa para melhorar sua vazao. Ainda assim, existe uma falta de cargas de trabalho que permitam avaliar diferentes mecanismos de RME de acordo com criterios comuns e representativos para classes de aplicacoes de interesse. Com base nisso, importantes aspectos comuns foram identificados no contexto de transacoes online, e propos-se o uso do TPC-C, o benchmark C do Comite de Desempenho de Processamento de Transacoes, para avaliar RMEs. Sua arquitetura para o contexto RME foi discutida e implementada em uma plataforma de replicacao. Resultados foram apresentados usando o modelo classico de RME. Alem disso, uma abordagem de RME paralelo foi discutida e implementada com esta carga de trabalho, e os resultados obtidos foram relatados., The availability of a system can be impacted by failures or attacks that exploit its vulnerabilities. Increasingly, more people rely on available online systems on the Internet. To minimize downtime risks, State Machine Replication (SMR) is a common approach. SMR is an important strategy for providing highly available services. However, increasing capacity in SMR systems is challenging due to its deterministic model, which requires research efforts to improve its parallelism. Nevertheless, there is a lack of workloads to evaluate different SMR mechanisms according to common and representative criteria for classes of applications of interest. Based on this, important common aspects were identified in the context of online transactions, and the use of TPC-C, the Transaction Processing Performance Council’s benchmark C, this work proposes to evaluate SMRs. Its architecture for the SMR context is discussed and an implementation on a replication platform is provided. TPC-C performance results are presented for the classic SMR model. Additionally, a parallel SMR approach is discussed, and implemented with this workload, and the results obtained reported.
Published: 2023

12. Técnicas energeticamente eficientes para o posicionamento de aplicações em computação na borda

Author: Ferreto, Tiago Coelho and Ferreto, Tiago Coelho
Abstract: O setor de Tecnologia da Informação e Comunicação (TIC) tornou-se relevante na economia global e a tendência é de que ele continue crescendo nos próximos anos. Esse setor utiliza dispositivos cujo funcionamento consome energia e produz calor, o que é problemático por motivos ambientais, socioeconômicos e tecnológicos. As técnicas de redução do consumo de energia destes dispositivos tipicamente envolvem seu desligamento temporário ou a utilização de estados de baixo consumo de energia, os quais podem impactar negativamente o desempenho do sistema. No paradigma de Computação na Borda, no entanto, aplicações usualmente possuem requisitos como baixa latência e baixo tempo de resposta. Este trabalho introduz duas técnicas de posicionamento de aplicações com foco no equilíbrio do compromisso entre eficiência energética e responsividade do sistema. A primeira técnica envolve a criação de um algoritmo de escalonamento baseado em prioridades com informações sobre a disponibilidade de um nodo. A segunda técnica utiliza Service Level Agreements (SLAs) de tempo de provisionamento e informações de disponibilidade dos nodos em um algoritmo genético de múltiplos objetivos na decisão de posicionamento das aplicações. Os resultados demonstram a eficácia de ambas as técnicas na redução do consumo de energia e na minimização das violações de SLAs., Information and Communication Technology has become an important sector in the global economy and the tendency is that it keeps growing in the foreseeable future. This sector utilizes devices whose functioning wastes energy and produces heat, which is problematic for environmental, socioeconomical and technological reasons. Techniques for reducing energy consumption of such devices typically involve shutting them off or placing them in low-power states, which may impact overall system performance. In the Edge Computing paradigm, however, applications usually have strict requirements such as low latency and low response time. This work presents two application placement techniques with the objective of balancing the tradeoff between energy efficiency and system responsiveness. The first technique involves the creation of a priority-based scheduling algorithm with node-availability information, while the second utilizes a deployment-SLA and node availability-driven scheduler using a multi-objective genetic algorithm. Results show the effectiveness of both application placement techniques in reducing energy consumption while minimizing Service-Level Agreement violations.
Published: 2022

13. Extração de informação em evoluções clínicas e integração com dados farmacogenômicos

Author: Bordini, Rafael Heitor and Bordini, Rafael Heitor
Abstract: A Extração de Informação (EI) abrange uma série de tarefas de Processamento de Linguagem Natural (PLN). Entre elas, o Reconhecimento de Entidades Nomeadas (REN) é uma tarefa que busca identificar as Entidades Nomeadas de um texto, tais como nomes de pessoas, locais e organizações, classificado-as em um conjunto pré-definido de categorias. Nesta dissertação pretendemos utilizar técnicas e ferramentas de PLN para a tarefa de REN no domínio Biomédico em Português. Portanto, realizamos a construção de um corpus específico e propomos dois modelos baseados em redes neurais capazes de processar o texto incluído em evoluções clínicas: BERT e uma rede neural convolucional (CNN). Além disso, foi introduzido um novo mecanismo para incorporar conhecimento farmacogenômico que sirva como base para auxiliar na decisão clínica. Os resultados mostram uma melhoria das medidas do modelo BERT em comparação à CNN e demonstram que os modelos baseados em Transformers são promissores para o avanço do desempenho de métodos de extração de informação para entidades no domínio Farmacológico em Português. O Reconhecimento de Entidades Nomeadas em evoluções clínicas está ganhando popularidade por melhorar os projetos de extração clínica. Este estudo permitiu à comunidade que trabalha com PLN, no contexto clínico, obter uma análise formal dessa tarefa, incluindo as formas mais bem-sucedidas de realizá-la., Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.
Published: 2022

14. Sequences of coalition structures in multi-agent systems applied to disaster response

Author: Bordini, Rafael Heitor, Dix, Jürgen, Bordini, Rafael Heitor, and Dix, Jürgen
Abstract: A formação de coalizões é um tópico de interesse da comunidade científica que estuda sistemas multiagentes devido aos desafios emergentes na utilização dessa técnica em aplicações práticas, assim como em virtude da complexidade envolvida para computar uma solução para o problema. Uma coalizão é uma organização de curta duração de agentes formada para atingir um objetivo em comum de seus integrantes. A teoria dos jogos cooperativos estabelece um mecanismo formal para análise dos grupos formados por diferentes agentes: as coalizões. Assim, o problema é modelado utilizando jogos de funções características (do inglês Characteristic- Function Game (CFG)) no qual o produto final de tal jogo é chamado de estrutura de coalizões: uma partição de um conjunto de agentes em coalizões. Entretanto, nem todos os problemas encontrados na prática podem ser resolvidos eficientemente utilizando uma única estrutura de coalizões. Por exemplo, pode ser necessário a formação de uma hierarquia de grupos na qual uma estrutura de coalizões é requerida por nível hierárquico. Na presente tese, problemas de formação de coalizões que são interdependentes são investigados.Especificamente, jogos de formação de coalizões são resolvidos individualmente e existe uma interdependência entre as soluções dos diferentes jogos. Visto a escassez de trabalhos científicos nesse tópico, um novo jogo é proposto, chamado de jogos sequenciais de funções características (do inglês Sequential Characteristic-Function Game (SCFG)), o qual visa modelar o relacionamento entre estruturas de coalizões subsequentes para o problema descrito por uma sequência de CFGs correspondente. O novo jogo proposto é estendido para modelar restrições induzidas sobre cada CFG na sequência de jogos. Além disso, por meio de uma análise teórica conclui-se que o problema subjacente ao SCFG é PSPACE-completo. Considerando uma perspectiva algorítmica, um algoritmo exato para computar soluções de instancias SCFG, assim como dois algoritmos heu, Coalition formation has long been an interesting topic of research in Multi-Agent Systems, either for its practical applications or complexity issues. A coalition is commonly understood as a short-lived and goal-directed structure, in which the agents join forces to achieve a goal. Cooperative game theory has been used as a formal mechanism to analyse the problem of grouping agents into coalitions. The problem is then modelled by a Characteristic-Function Game (CFG) in which the outcome is a coalition structure: a partition of agents into coalitions. However, not all problems can be effciently solved using a single coalition structure. For instance, one might be interested in a group hierarchy in which a coalition structure per level is required. In this thesis, we investigate coalition formation problems that are interdependent. In particular, we focus on the interdependence among solutions (i.e., coalition structures) produced by each game individually. Given the lack of work on this topic, we propose a novel game named Sequential Characteristic-Function Game (SCFG), which aims to model the relationships between subsequent coalition structures in a sequence of CFGs.We approach the resulting problem under both theoretical and practical perspectives. We extend the proposed game to allow fine-grained constraints being induced over each CFG in the sequence. Also, we show that the underlying SCFG problem is PSPACE-complete. From an algorithmic viewpoint, we propose an exact algorithm based on dynamic programming, as well as two heuristic algorithms to compute solutions for SCFG instances. We show that there exists a trade-off in choosing one algorithm over the others. Moreover, we model a disaster response operation that employs the incident command system framework, and we show how one can apply our proposed framework and algorithms to solve such an interesting problem.
Published: 2022

15. Self-adaptive abstractions for efficient high-level parallel computing in multi-cores

Author: Fernandes, Luiz Gustavo Leão, Danelutto, Marco, Griebler, Dalvan Jair, Fernandes, Luiz Gustavo Leão, Danelutto, Marco, and Griebler, Dalvan Jair
Abstract: Atualmente, uma parte significativa dos sistemas computacionais e aplicações do mundo real demandam paralelismo para acelerar suas execuções. Embora a programação paralela estruturada e de alto nível tenha como objetivo facilitar a exploração do paralelismo, ainda há questões a serem abordadas para melhorar as abstrações existentes na programação paralela, onde os desenvolvedores de aplicações usualmente precisam definir configurações de paralelismo não intuitivas ou complexas. Nesse contexto, a autoadaptação é uma alternativa potencial para fornecer um nível mais alto de abstrações autonômicas e capacidade de resposta em tempo de execução em aplicações paralelas. No entanto, um problema recorrente é que a autoadaptação ainda é limitada em termos de flexibilidade, eficiência e abstrações. Por exemplo, faltam mecanismos para aplicar ações de adaptação e estratégias eficientes de decisão sobre quais configurações devem ser aplicadas em tempo de execução. Este trabalho é focado em abstrações alcançáveis com autoadaptação gerenciando de forma transparente as execuções enquanto os programas paralelos estão sendo executados. Os principais objetivos são: aumentar o espaço de adaptação para ser mais representativo para aplicações e tornar a autoadaptação mais eficiente com metodologias de avaliação abrangentes, que podem fornecer casos de uso que demonstrem os verdadeiros potenciais da autoadaptação.Portanto, esta tese de doutorado traz as seguintes contribuições científicas: I) Uma revisão sistemática da literatura fornecendo uma taxonomia do estado da arte. II) Um framework conceitual para apoiar a concepção e abstração do processo de tomada de decisão dentro de soluções autoadaptativas, o que é utilizado nas contribuições técnicas para ajudar a tornar as soluções mais modulares e potencialmente generalizáveis. III) Mecanismos e estratégias para réplicas autoadaptáveis em aplicações com estágios paralelos simples e múltiplos, suportando múltiplos requisitos não-funcionais, Nowadays, a significant part of computing systems and real-world applications demand parallelism to accelerate their executions. Although high-level and structured parallel programming aims to facilitate parallelism exploitation, there are still issues to be addressed to improve existing parallel programming abstractions. Usually, application developers still have to set non-intuitive or complex parallelism configurations. In this context, self-adaptation is a potential alternative to provide a higher-level of autonomic abstractions and runtime responsiveness in parallel executions. However, a recurrent problem is that self-adaptation is still limited in terms of flexibility, efficiency, and abstractions. For instance, there is a lack of mechanisms to apply adaptation actions and efficient decisionmaking strategies to decide which configurations to be enforced at run-time. In this work, we are interested in abstractions achievable with self-adaptation transparently managing the executions while the parallel programs are running (at run-time). Our main goals are to increase the adaptation space to be more representative of real-world applications and make self-adaptation more efficient with comprehensive evaluation methodologies, which can provide use-cases demonstrating the true potentials of self-adaptation.Therefore, this doctoral dissertation provides the following scientific contributions: I) An Systematic Literature Review (SLR) providing a taxonomy of the state-of-the-art. II) A conceptual framework to support designing and abstracting the decision-making process within selfadaptive solutions, such a conceptual framework is then employed in the technical contributions to assist in making the solutions more modular and potentially generalizable. III) Mechanisms and strategies for self-adaptive replicas in applications with single and multiple parallel stages, supporting multiple customizable non-functional requirements. IV) Mechanism, strategy, and optimization
Published: 2022

16. Minimizing container-based applications SLA violations on edge computing environments

Author: Ferreto, Tiago Coelho and Ferreto, Tiago Coelho
Abstract: O surgimento de aplicações com requisitos rígidos como baixa latência e privacidade motivou a aproximação de recursos computacionais e usuários na borda da rede devido às dificuldades do paradigma de computação em nuvem em suprir tais necessidades. Nesse novo paradigma de computação distribuída, assim como em computação em nuvem, as técnicas de virtualização baseadas em contêiner também são consideradas para provisionamento de aplicações devido ao baixo consumo de recursos, rápido provisionamento e baixo espaço de armazenamento em comparação com máquinas virtuais (VM). No entanto, a alta variabilidade da capacidade computacional e largura de banda dos nós de borda impactam diretamente no tempo de provisionamento das aplicações em um ambiente de computação de borda. Além disso, a localização dos usuários finais também é um fator importante a ser considerado ao escalonar as aplicações, pois a distância entre os usuários e os nós de borda afeta a latência da comunicação. Nesse contexto, este trabalho apresenta um novo algoritmo de escalonamento, chamado Latency and Provisioning Time SLA Driven Scheduler (LPSLA), que coordena o provisionamento de aplicações em infraestruturas de borda para minimizar as violações de Service Legel Agreements (SLA) em termos de latência e tempo de provisionamento. O algoritmo proposto considera a latência entre a localização dos usuários finais e os nós de borda e a capacidade dos nós de borda em baixar aplicações baseadas em contêiners. Como resultado, a solução proposta é capaz de minimizar as violações de SLA em todos os cenários avaliados., The emergence of applications with strict requirements such as low latency and privacy motivated the approximation of computing resources and users at the network’s edge due to the difficulties of the cloud computing paradigm in fulfilling such needs. In this new distributed computing paradigm, like cloud computing, container-based virtualization techniques are also considered for application provisioning due to low resource consumption, fast provisioning, and low storage footprint compared to virtual machines (VM). However, the high variability of the edge nodes’ computational capacity and bandwidth directly impact the applications’ provisioning time in an edge computing environment. In addition, the end-users location is also an important factor to consider when scheduling applications, as the distance between end-users and edge nodes impacts communication latency. In this context, this work presents a novel scheduling algorithm, called Latency and Provisioning Time SLA Driven Scheduler (LPSLA), which coordinates application provisioning on edge infrastructures to minimize latency and provisioning time Service Legel Agreements (SLA) violations. It considers the latency between the end-users location and edge nodes and the capacity of edge nodes in downloading the container-based applications. As a result, the proposed solution is capable of minimizing the SLA violations in all evaluated scenarios.
Published: 2022

17. A model for automatized data integration in hadoop-based data lakes

Author: Ruiz, Duncan Dubugras Alcoba and Ruiz, Duncan Dubugras Alcoba
Abstract: A imensa quantidade de dados que são gerados atualmente pelos nossos sistemas computacionais e dispositivos, conhecida por big data, requer tecnologias específicas, como data lakes, para que possam ser armazenados, processados e distribuídos. Data lakes são arquiteturas onde dados dos mais diversos formatos são armazenados para que sejam consultados quando necessário, sem a necessidade de esquemas prévios. Data lakes possibilitam o gerenciamento de ecossistemas de big data, e, hoje em dia, a maioria é criada tendo como base o framework Hadoop. Um dos desafios relacionados a data lakes é a integração dos dados de variados formatos. A integração dos dados é uma tarefa complexa que requer a atenção de um especialista, toma tempo e é sujeita a erros. Contudo, essa tarefa pode ser facilitada se forem utilizadas técnicas para conhecer o perfil dos dados. Nesta tese, desenvolve-se um modelo para automatizar o processo de integração de dados heterogêneos em data lakes baseados em Hadoop. O método desenhado para auxiliar a atingir os objetivos de pesquisa divide-se em 5 fases: Fundamentação, Implementação, Experimentação, Avaliação e Modelo final. As principais contribuições desta tese incluem os achados de três revisões sistemáticas da literatura, onde são exaustivamente discutidos os temas relacionados a data lakes, big data profiling e integração de dados em data lakes, e que serviram de base para o desenvolvimento de um modelo que possibilita a integração automatizada de dados heterogêneos em data lakes baseados no Hadoop, além dos experimentos com dados de bioinformática., The massive amount of data currently generated by our computing systems and devices, known as big data, require specific technologies to be stored, processed, and distributed. Data lakes are architectures to store data of various formats to be queried when necessary, without needing a predefined schema. Data lakes aim to manage big data ecosystems, and most are currently created based on the Hadoop framework. A known challenge related to data lakes is integrating data from different formats. Data integration is a complex task that requires the attention of a specialist, besides being time-consuming and error-prone. However, this task can be facilitated if we use techniques to know the data profile. This thesis develops a model to automate the heterogeneous data integration process in Hadoop-based data lakes. In this sense, we design a method with five phases to help achieve the research objective: Foundation, Implementation, Experimentation, Evaluation, and Final Model. Our main contributions include the findings of three systematic literature reviews, where we deeply discuss themes related to data lakes, big data profiling, and data integration in data lakes, which served as a basis for the development of a model that enables the automatized integration of heterogeneous data in Hadoop-based data lakes, besides the experiments with bioinformatics data.
Published: 2022

18. Framework para compartilhamento do conhecimento em equipes multidisciplinares que usam metodologia ágil no desenvolvimento de produtos digitais

Author: Oliveira, Mírian and Oliveira, Mírian
Published: 2022

19. Aplicação de aprendizado de máquina para descobertas de farmacogenômica no tratamento do câncer de esôfago

Author: Bordini, Rafael Heitor and Bordini, Rafael Heitor
Abstract: A farmacogenômica é a área que estuda como as variações genômicas podem influenciar na resposta aos medicamentos. Através dela é possível explorar e definir os medicamentos mais indicados para diferentes pessoas e seus perfis genéticos, a fim de tornar os tratamentos mais personalizados. Estudos recentes mapeiam a resposta de linhagens celulares relacionadas ao câncer para uma ampla coleção de fármacos utilizados em tratamentos, aplicando técnicas de aprendizado de máquina para tarefas de predição. O objetivo dessa dissertação é desenvolver modelos de redes neurais profundas buscando predizer a resposta de diferentes perfis para 174 fármacos de tratamento do câncer de esôfago. Foram construídos modelos de aprendizagem profunda que, integrando dados do perfil de expressão, mutações e dados clínicos, estimam a resposta de diferentes compostos, com base nos valores de IC50. Foram aplicadas estruturas de autocodificadores para extração de representação dos dados de treinamento, aliado a uma rede neural profunda. O modelo inicial obteve resultados positivos em comparação a trabalhos anteriores e, a partir destes, foram exploradas formas de aprimorar a predição da rede neural. Foi introduzida uma nova arquitetura com a integração dos dados clínicos devido a importância dos fatores de risco relacionados aos casos de câncer de esôfago. Além disso, outra motivação para explorar esses dados é que ainda são mais comuns de serem obtidos na prática clínica. Os modelos apresentaram resultados de 0,74 e 0,72 respectivamente, considerando a métrica de avaliação de erro médio quadrático.Apesar dos resultados positivos, foram identificadas limitações da implementação, especialmente sobre os dados clínicos em relação a sua quantidade e qualidade da informação. Os resultados experimentais mostram que o tema de pesquisa é promissor e podem levar a inovações capazes de melhora na qualidade de vida dos pacientes., Pharmacogenomics is the area that studies how genomic variations influence drug response. Through it studies, it is possible to explore and define the most suitable drugs for different patients and their genetic profiles, in order to make treatments more personalized. Recent studies map the response of cancer-related cell lines to a wide collection of drugs used in treatments, applying machine learning techniques for prediction tasks. Our goal is to develop deep neural network models seeking to predict the response of different profiles to 174 drugs used for the treatment of esophageal cancer. Deep learning models were built to estimate the response of different compounds, based on its IC50 values, by integrating expression, mutation and clinical data. Autoencoders were developed to extract the representation of the training data, combined with a deep neural network. The initial model obtained positive results compared to previous work and based on these we explored new approaches to improve the neural network. We introduced a new architecture with the integration of clinical data due to the importance of risk factors related to esophageal cancer cases. Furthermore, another motivation to explore these data is that they are still more common to be obtained in clinical practice. The models presented results of 0.74 and 0.72 respectively, considering the mean squared error evaluation metric. Despite the positive results, implementation limitations were identified, especially regarding clinical data in terms of quantity and quality of information. The experimental results show that the research topic is promising and can lead to innovations capable of improving the quality of life of patients.
Published: 2022

20. An efficient model for identifying firearm threats in videos

Author: Manssour, Isabel Harb and Manssour, Isabel Harb
Abstract: Para que uma sociedade prospere, seus membros devem se sentir seguros em suas vidas cotidianas; caso contrário, o medo começaria a tomar conta da população, causando estresse e pânico e, consequentemente, reduzindo a qualidade de vida. Diversas políticas e medidas costumam a ser adotadas para preservar a segurança das pessoas, mas a medida que a população cresce e armas de fogo se tornam mais acessíveis, a segurança da sociedade fica mais ameaçada. Preocupados com isso, diversos trabalhos buscaram explorar o uso de câmeras de segurança, uma das medidas de segurança mais utilizadas, e identificar um evento de ameaça. No entanto, esses trabalhos não possuem práticas comuns de comparação, conjuntos de dados padrão ou restrições para os conjuntos de dados usados. O principal objetivo deste trabalho é explorar métodos e estratégias para enfrentar o desafio da detecção de ameaça à mão armada, assumindo um cenário de sistema de vigilância com hardware limitado. Para atingir esse objetivo, buscamos redes neurais eficientes do estado da arte e técnicas de compressão de modelos para termos uma base sólida e estratégias bem desenvolvidas que pudessem melhorar ainda mais seu desempenho. Também propomos um novo conjunto de dados desafiador para identificar ameaças à mão armada que segue critérios rigorosos para garantir a qualidade dos dados utilizados. Até onde sabemos, o nosso é o maior conjunto de dados disponível na área com anotações para detecção de objetos e que usa apenas dados de mundo real. Nosso conjunto de dados está disponível online, juntamente com as ferramentas usadas para criá-lo, facilitando sua capacidade de expansão. Além disso, avaliamos o desempenho de alguns métodos do estado da arte nele, e os resultados obtidos corroboram sua dificuldade.Fornecemos um conjunto extenso de experimentos para demonstrar os pontos fortes e fracos de cada abordagem e seu impacto nas detecções. Também realizamos experimentos em diferentes ambientes para avaliar como essas abord, For a society to prosper, its members must feel safe in their everyday lives; otherwise, fear would start to take over the population, causing stress and panic and, consequently, reducing the quality of life. Several policies and measures are usually adopted to preserve people’s security, but as the population grows and firearms become more accessible, society’s security becomes more threatened. Concerned with this, several works sought to explore the use of security cameras, one of the most commonly used security measures, and identify when a threatening event occurs. However, these works do not have common comparison practices, standard datasets, or constraints for the datasets used. The main goal of this work is to explore methods and strategies to address the challenge of firearm threat detection while assuming a scenario of a surveillance system with limited hardware. To achieve this goal, we sought well-known efficient neural networks from the state-of-the-art and model-compression techniques to have a solid basis to start from and well-developed strategies that could further improve their performance. We also propose a new challenging dataset for identifying firearm threats that follows rigorous controls to ensure the quality of the data used. To the best of our best knowledge, ours is the largest dataset available in the area based on frame-level annotations and that uses only real-world data. Our dataset is available online, alongside the tools used to create it, making it easier to expand it further. Moreover, we evaluated the performance of some state-of-the-art methods on it, and the obtained results corroborate with its difficulty. We provide an extensive set of experiments to present clearly each approach’s strengths and weaknesses and their impact on the detection performance.For a society to prosper, its members must feel safe in their everyday lives; otherwise, fear would start to take over the population, causing stress and panic and, consequently
Published: 2022

21. Uma abordagem multitarefa para avaliação cérebro-comportamento a partir de ressonância magnética funcional

Author: Sales, Afonso Henrique Corrêa de, Meneguzzi, Felipe Rech, Sales, Afonso Henrique Corrêa de, and Meneguzzi, Felipe Rech
Abstract: O exame de ressonância magnética funcional é utilizado para verificar o comportamento das redes cerebrais em pesquisas de desordens cerebrais e distúrbios cognitivos. Para compor essa avaliação, dados comportamentais e testes clínicos padronizados podem ser associados. Algoritmos lineares são utilizados na literatura para encontrar correlação entre os dados das imagens e uma variável comportamental alvo, valor final de um teste cognitivo, por exemplo. Quando há mais de uma variável a ser predita, pode ser utilizado algoritmos com aprendizado multitarefa. Considerando a premissa de que quando tarefas são relacionadas podem ser preditas em simultâneo, o presente trabalho visa desenvolver uma abordagem multitarefa utilizando redes baseadas em grafos para responder a seguinte questão de pesquisa: é possível prever múltiplas variáveis comportamentais com aprendizado multitarefa e verificar regiões cerebrais em comum considerando como entrada dados de rs-fMRI? Nossa abordagem demonstrou performance competitiva em relação com a literatura de abordagens single. Além disso, validamos que regiões do cérebro tiveram suas importâncias alteradas entre os modelos, sendo 53 regiões com mudança significativa na população pareada e escores submetidos ao teste de Wilcoxon na importância atribuída pelos modelos single e multi., Functional magnetic resonance imaging is used to verify the behavior of brain networks in cognitive disorders. To compose this assessment, behavioral data and standardized clinical tests can be associated. Linear algorithms are used in the literature to find a correlation between image data and a target behavioral variable, the final value of a cognitive test, for example. When there is more than one variable to be predicted, algorithms with multitasking learning can be used. Considering the premise that when tasks are related they can be predicted simultaneously, the present work aims to develop a multitasking approach using graph convolutional networks to answer the following research question: is it possible to predict multiple behavioral variables with multitasking learning and verify brain regions in common considering how to input data from rs-fMRI? Our approach demonstrated competitive performance in relation to the literature on single approaches. In addition, we validated which brain regions had their importance altered between the models, with 53 brain regions with a significant change in the matched population and scores submitted to the Wilcoxon test in the importance attributed by the single and multi models.
Published: 2022

22. Visual analytics para o acompanhamento de modelos de credit scoring

Author: Manssour, Isabel Harb and Manssour, Isabel Harb
Abstract: Modelos de Credit Scoring são utilizados por instituições financeiras com o objetivo de predizer a inadimplência de seus clientes e auxiliar na tomada de decisão sobre a concessão de crédito. Como há um grande volume de transações de crédito sendo gerado diariamente e um potencial aumento dessas informações com o advento do open finance, existe o desafio de conseguir monitorar essas informações de forma rápida para que se possa atuar em caso de perda de desempenho desses modelos. Diversos trabalhos encontrados na literatura visam aperfeiçoar as técnicas utilizadas na etapa de construção do modelo. No entanto, não encontramos trabalhos relacionados ao acompanhamento destes modelos. Considerando este contexto, o principal objetivo desta pesquisa foi criar uma abordagem de Visual Analytics para auxiliar na gestão de modelos de crédito. Para isto, inicialmente, realizamos uma revisão sistemática da literatura sobre o tema e conduzimos entrevistas semiestruturadas com 13 profissionais que possuem experiência na área. Considerando as necessidades levantadas com este estudo, criamos um protótipo chamado VACS (Visual Analytics para o Acompanhamento de Modelos de Credit Scoring). As principais contribuições deste trabalho são: (a) Os resultados obtidos com a revisão sistemática da literatura que mostram que há uma lacuna sobre o tema e que permitiram identificar insights sobre o uso de Visual Analytics e análise de cenários no acompanhamento destes modelos.(b) O levantamento de requisitos realizado por meio das entrevistas com especialistas, que permitiu o registro de como os modelos são acompanhados dentro das instituições financeiras, algo que não é divulgado devido ao sigilo do dados e que pode ajudar na padronização dos monitoramentos; (c) O VACS, que foi avaliado por quatro especialistas de domínio que o classificaram como uma ferramenta muito completa e fácil de usar; (d) As sugestões coletadas na etapa de feedbacks, que contribuirão no aprimoramento do VACS e em traba, Financial institutions use credit Scoring models to predict the default of their customers and assist in decision-making about the granting of credit. As there is a large volume of credit transactions being generated daily and a potential increase in this information with the advent of Open Finance, there is the challenge of being able to monitor this information quickly so we can act in case of loss of performance of these models. Several works found in the literature aim to improve the techniques used in the model construction stage. However, we did not find studies related to monitoring these models. Considering this context, the main objective of this research was to create a Visual Analytics approach to assist in the management of credit models. For this, initially, we carried out a systematic review of the literature on the subject and conducted semi-structured interviews with 13 professionals who have experience in the area. Considering the needs raised with this study, we created a prototype called VACS (Visual Analytics for Tracking Credit Scoring Models). The main contributions of this work are: (a) The results obtained from the systematic review of the literature shows that there is a gap on the subject and allowed us to identify insights into the use of visual analytics and scenario analysis in monitoring those models; (b) The survey of requirements carried out through interviews with specialists, which allowed the recording of how the models are monitored within financial institutions, something that is not disclosed and that can help in the standardization; (c) VACS, which was evaluated by four domain experts who rated it as a very complete and easy-to-use tool; (d) The suggestions collected in the feedback stage, which will contribute to the improvement of VACS and future work.
Published: 2022

23. Interference-aware cloud scheduling architecture for dynamic latency-sensitive workloads

Author: De Rose, César Augusto Fonticielha and De Rose, César Augusto Fonticielha
Abstract: Os sistemas de computação continuam a evoluir para facilitar o aumento do desempenho ao processar cargas de trabalho em grandes data centers. A virtualização é uma tecnologia que permite que vários aplicativos sejam executados em um único computador físico, gerando várias vantagens, incluindo rápido provisionamento de recursos e melhor utilização de hardware. Os provedores de computação em nuvem adotam essa estratégia para usar sua infraestrutura de forma mais eficiente, reduzindo o consumo de energia. Apesar disto, nossas pesquisas na área têm mostrado que vários serviços em nuvem competindo por recursos compartilhados são suscetíveis à interferência entre aplicativos, o que pode levar a uma degradação significativa do desempenho e, consequentemente, a um aumento de quebras no número de acordos de nível de serviço. No entanto, o escalonamento de recursos de última geração em ambientes virtualizados ainda depende principalmente da capacidade dos recursos, adotando heurísticas como o bin-packing, ignorando essa fonte de sobrecarga. Mas, nos últimos anos, o escalonamento com reconhecimento de interferência ganhou força, com a investigação de maneiras de classificar os aplicativos em relação ao seu nível de interferência e a proposta de modelos estáticos e políticas para o escalonamento de aplicativos co-hospedados em nuvem. Os resultados preliminares nesta área já mostram uma melhoria considerável na redução de quebra de SLAs, mas acreditamos fortemente que ainda existem oportunidades de melhoria nas áreas de classificação de aplicações e estratégias de escalonamento dinâmico.Portanto, o objetivo principal deste trabalho é estudar o comportamento dos perfis de interferência dos aplicativos em nuvem ao longo de todo o seu ciclo de vida e sua suscetibilidade às variações da carga de trabalho, em busca de oportunidades para melhorar o compartilhamento de recursos em ambientes virtualizados com novas estratégias de escalonamento dinâmico. Para tanto, exploramos algumas qu, Computing systems continue to evolve to facilitate increased performance when processing workloads in large data centers. Virtualization technology enables multiple applications to be created and executed on a single physical computer, yielding various advantages, including rapid provisioning of resources and better utilization of hardware. Cloud computing providers have adopted this strategy to use their infrastructure more efficiently, reducing energy consumption. However, our research in this field has shown that multiple cloud services contending for shared resources are susceptible to crossapplication interference, which can lead to significant performance degradation and consequently an increase in the number of broken service level agreements (SLA). Nevertheless, state-of-the-art resource scheduling in virtualized environments still relies mainly on resource capacity, adopting heuristics such as bin-packing, thus overlooking this source of overhead. But in recent years interference-aware scheduling has gained traction, and applications are now being classified based on their interference level and the proposal of static cost models and policies for scheduling co-hosted cloud applications. Preliminary results in this area already show a considerable improvement in the reduction of broken SLAs, yet we strongly believe that there are still opportunities to improve in the areas of application classification and dynamic scheduling strategies.Therefore, this work’s primary goal is to study the behavior of cloud applications’ interference profiles over their entire life cycle, and their susceptibility to workload variations, looking for opportunities to improve resource sharing in virtualized environments with novel dynamic scheduling strategies. To this end, we explored some specific research questions related to the dynamic nature of the process, such as: How can applications be classified based on resource interference in real-time? When should classifications be
Published: 2022

24. A framework for fast architecture exploration of convolutional neural network accelerators

Author: Moraes, Fernando Gehm, Moreira, Matheus Trevisan, Moraes, Fernando Gehm, and Moreira, Matheus Trevisan
Abstract: Aprendizado de Máquina (ML, do inglês, Machine Learning) é uma subárea da inteligência artificial que compreende algoritmos para resolver problemas de classificação e reconhecimento de padrões. Uma das maneiras mais comuns de desenvolver ML atualmente é usando Redes Neurais Artificiais, especificamente Redes Neurais Convolucionais (CNN, do inglês, Convolutional Neural Networks). As GPUs tornaram-se as plataformas de referência para as fases de treinamento e inferência das CNNs devido à sua arquitetura adaptada aos operadores da CNN. No entanto, as GPUs são arquiteturas que consomem muita energia. Um caminho para permitir a implementação de CNNs em dispositivos com restrição de energia é adotar aceleradores de hardware para a fase de inferência. No entanto, a literatura apresenta lacunas em relação às análises e comparações desses aceleradores para avaliar os compromissos Potência-Desempenho-Área (PPA, do inglês, Power-Performance-Area). Normalmente, a literatura estima PPA a partir do número de operações executadas durante a fase de inferência, como o número de MACs (do inglês, Multiplier-Accumulator), o que pode não refletir o comportamento real do hardware.Assim, é necessário fornecer estimativas de hardware precisas, permitindo a exploração do espaço de projeto (DSE, do inglês, Design Space Exploration) para implementar as CNNs de acordo com as restrições de projeto. Esta Tese propõe duas abordagens de DSE para CNNs. A primeira adota um simulador de sistema com precisão de ciclo de relógio e usa uma linguagem de alto nível para descrever o hardware de forma abstrata. Essa primeira abordagem, usa o TensorFlow como front-end para treinamento, enquanto o back-end gera estimativas de desempenho por meio da síntese física de aceleradores de hardware. A segunda abordagem, é um DSE rápido e preciso, usando um modelo analítico construído a partir dos resultados da síntese física de aceleradores de hardware. O modelo analítico estima a área de silício, desempenho, potênci, Machine Learning (ML) is a sub-area of artificial intelligence comprehending algorithms to solve classification and pattern recognition problems. One of the most common ways to deliver ML nowadays is using Artificial Neural Networks, specifically Convolutional Neural Networks (CNN). GPUs became the reference platforms for both training and inference phases of CNNs due to their tailored architecture to the CNN operators. However, GPUs are powerhungry architectures. A path to enable the deployment of CNNs in energy-constrained devices is by adopting hardware accelerators for the inference phase. However, the literature presents gaps regarding analyses and comparisons of these accelerators to evaluate Power-Performance-Area (PPA) trade-offs. Typically, the literature estimates PPA from the number of executed operations during the inference phase, such as the number of Multiplier-Accumulators (MAC), which may not reflect the actual hardware behavior. Thus, it is necessary to deliver accurate hardware estimations, enabling design space exploration (DSE) to deploy CNNs according to the design constraints. This Thesis proposes two DSE approaches for CNNs. The former adopts a cycle-accurate system simulator and uses a highlevel language to describe the hardware abstractly.This first approach uses TensorFlow as a front-end for training, while the back-end generates performance estimations through physical synthesis of hardware accelerators. The second approach is a fast and accurate DSE, using an analytical model fitted from the physical synthesis of hardware accelerators. The analytic model estimates area, performance, power, energy, and memory accesses. The observed worst-case average error comparing the analytical model to the data obtained from the physical synthesis is smaller than 8%. Although the second approach generate accurate results in a fast way, the first approach enables simulating a complete computational system, considering a possible accelerators modeling r
Published: 2022

25. Apoio à construção de visualizações narrativas de dados com ênfase em gêneros narrativos

Author: Silveira, Milene Selbach and Silveira, Milene Selbach
Abstract: Há um crescente interesse em apresentar dados de uma maneira mais clara aos usuários. Uma das formas de aumentar o engajamento e a compreensão destes dados é por meio de visualizações narrativas, pois elas utilizam elementos que, de diferentes formas, podem aprimorar o entendimento em relação aos dados apresentados. Neste contexto, inicialmente foi realizada uma revisão da literatura, na qual foram identificados os elementos e características fundamentais de uma visualização narrativa de dados, como gêneros narrativos, técnicas, ferramentas utilizadas, domínios de aplicação e principais desafios relacionados ao tópico. Percebeu-se, então, uma oportunidade de pesquisa acerca da relação entre esses elementos e a estrutura dos gêneros narrativos, tema discutido em um grupo de foco com profissionais que possuiam conhecimento na área de visualização de dados.A partir deste estudo, foi identificada a falta de trabalhos que descrevessem gêneros narrativos em detalhes. Assim, foram realizados novos estudos na literatura e com usuários, a fim de caracterizar os gêneros narrativos em profundidade, em busca de atingir o objetivo desta pesquisa: apoiar os profissionais na construção de visualizações narrativas. Como principais resultados, obteve-se a elaboração de um guia de apoio à construção dessas visualizações, criado a partir de estruturas de componentes dos gêneros narrativos identificadas. Posteriormente, o guia foi analisado em um workshop com profissionais da área e, apesar de alguns ajustes sugeridos e necessários, foi considerado claro e útil, principalmente por parte dos profissionais que não possuem conhecimento prévio sobre elementos narrativos, mostrando que o mesmo filtrou muitas questões e os direcionou na construção da visualização., There is a growing interest in presenting data more clearly to users. One of the ways to increase engagement and understanding of this data is through narrative visualizations, as they use elements that, in different ways, can improve understanding of the data presented. In this context, we performed a literature review to identify narrative data visualization’s fundamental elements and characteristics, such as narrative genres, techniques, tools used, application domains, and challenges related to the topic. Then, we identified an opportunity for research on the relationship between these elements and the narrative genres. To investigate this topic, we held a focus group with data visualization professionals to discuss it. From this study, we identified a lack of works that address narrative genres in detail. Therefore, new studies were realized to characterize narrative genres in-depth, seeking to achieve the objective of this research: to support professionals in the construction of narrative visualizations. As the main result, we present a guide to support the design of narrative visualizations, created from components structures of the identified narrative genres. Subsequently, we ran a workshop with professionals to analyze the guide. Despite some suggested and necessary adjustments, it was considered clear and valuable, especially for professionals who do not have previous knowledge about narrative elements, showing that it answered many questions and guided them in building the visualization.
Published: 2022

26. Data and stream parallelism optimizations on GPUs

Author: Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, Fernandes, Luiz Gustavo Leão, and Griebler, Dalvan Jair
Abstract: Nos dias de hoje, a maioria dos computadores são equipados com unidades de processamento gráfico (GPUs) para prover capacidade massiva de paralelismo a baixo custo. Para explorar completamente a capacidade destas arquiteturas é necessário o uso de programação paralela. No entanto, isso representa um desafio para os programadores, pois requer a refatoração de algoritmos, técnicas de paralelismo e conhecimento específico sobre o hardware. Além disso, o paralelismo das GPUs é ainda mais desafiador, pois GPUs possuem características de hardware peculiares, e outro paradigma de paralelismo chamado de programação many-core. Nesse sentido, pesquisas de computação paralela tem se concentrado no estudo de técnicas de programação eficientes para GPUs, e também no desenvolvimento de abstrações que diminuem o esforço de programação. SPar é uma linguagem específica de domínio (DSL) que segue essa direção de pesquisa. Programadores podem utilizar a SPar para expressar paralelismo de stream sem impactar significativamente o desempenho. A SPar oferece abstrações de alto nível através de anotações no código-fonte, enquanto o compilador da SPar gera código paralelo. Recentemente foi adicionada uma extensão na SPar, a qual permite que seja gerado código paralelo para CPUs e GPUs em aplicações de stream. Os núcleos da CPU controlam o fluxo de dados, e a GPU aplica paralelismo massivo na computação de cada elemento do fluxo de dados. Para este fim, a SPar gera código para uma biblioteca intermediária chamada GSParLib. GSParLib é uma API paralela orientada a padrões que provê um modelo único de programação para a runtime dos frameworks CUDA e OpenCL, permitindo a exploração do paralelismo em GPUs de diferentes fabricantes.Porém, o suporte para GPUs em ambas SPar e GSPar- Lib ainda está em seus passos iniciais; SPar e GSParLib oferecem apenas funcionalidades básicas, e nenhum estudo avaliou o desempenho de forma abrangente. A contribuição deste trabalho concentra-se em paralelizar benchma, Nowadays, most computers are equipped with Graphics Processing Units (GPUs) to provide massive-scale parallelism at a low cost. Parallel programming is necessary to exploit this architectural capacity fully. However, it represents a challenge for programmers since it requires refactoring algorithms, designing parallelism techniques, and hardwarespecific knowledge. Moreover, GPU parallelism is even more challenging since GPUs have peculiar hardware characteristics and employ a parallelism paradigm called many-core programming. In this sense, parallel computing research has focused on studying efficient programming techniques for GPUs and developing abstractions that reduce the effort when writing parallel code. SPar is a domain-specific language (DSL) that goes in this direction. Programmers can use SPar to express stream parallelism in a simpler way without significantly impacting performance. SPar offers high-level abstractions via code annotations while the SPar compiler generates parallel code. SPar recently received an extension to allow parallel code generation for CPUs and GPUs in stream applications. The CPU cores control the flow of data in the generated code. At the same time, the GPU applies massive parallelism in the computation of each stream element. To this end, SPar generates code for an intermediate library called GSParLib, a pattern-oriented parallel API that provides a unified programming model targeting CUDA and OpenCL runtime, allowing parallelism exploitation of different vendor GPUs. However, the GPU support for both SPar and GSParLib is still in its initial steps; they provide only basic features, and no studies have comprehensively evaluated SPar and GSParLib’s performance.This work contributes by parallelizing representative high-performance computing (HPC) benchmarks, implementing new features and optimizations for GPUs in the GSParLib and SPar, and presenting a method for providing agnostic frameworks independent of low-level programming i
Published: 2022

27. Uma análise sobre a acurácia e a escalabilidade de algoritmos paralelos de detecção de comunidades em grafos

Author: De Rose, César Augusto Fonticielha and De Rose, César Augusto Fonticielha
Abstract: Detecção de comunidades é um tipo de análise topológica amplamente utilizada em análise de grafos de diversas áreas como análise de redes sociais, bioinformática e sistemas de recomendação. O problema compreende detectar componentes que apresentam alta densidade interna e baixa densidade externa. Devido ao rápido crescimento do volume de dados de diversas aplicações e à ampla utilização deste tipo de análise, diversas pesquisas em abordagens paralelas e distribuídas para resolver o problema de detecção de comunidades surgiram. Alguns algoritmos possuem maior popularidade, resultando em uma extensa quantidade de pesquisa dentro de otimizações para processamento paralelo. Outros algoritmos, mesmo possuindo bons resultados de acurácia em testes, não apresentam o mesmo nível de profundidade de pesquisa em suas versões paralelas e distribuídas. Esta pesquisa aborda a acurácia e escalabilidade de três algoritmos de detecção de comunidades. A partir dos experimentos realizados são propostas diretrizes para a utilização de cada algoritmo de acordo com as necessidades do usuário. Além disso, é explorado o comportamento das abordagens paralelas e possíveis melhorias são propostas., Community detection is a type of topological analysis widely used in graph analysis in several fields such as social network analysis, bioinformatics and recommendation systems. The problem involves detecting components that have high internal density and low external density. Due to the rapid growth in the volume of data from a variety of applications and the wide use of this type of analysis, several researches in parallel and distributed approaches to solve the problem of community detection have emerged. Some algorithms are more popular, resulting in an extensive amount of research on optimizations for parallel processing. Other algorithms, which posses better accuracy results in tests, do not present the same level of research depth in their parallel and distributed versions. This research addresses the accuracy and scalability of three community detection algorithms. User guidelines are proposed based on the experiments results. In addition, the behavior of the parallel approaches is explored and possible improvements are proposed.
Published: 2022

28. Mitigating bias in facial analysis systems by incorporating label diversity

Author: Musse, Soraia Raupp, Veloso, Adriano Alonso, Musse, Soraia Raupp, and Veloso, Adriano Alonso
Abstract: Modelos de análise facial são cada vez mais utilizados em aplicações do mundo real que têm impacto significativo na vida das pessoas. No entanto, como demonstrado pela literatura, os modelos que classificam automaticamente os atributos faciais podem apresentar comportamento de discriminação em relação a grupos protegidos, potencialmente causando impactos negativos nos indivíduos e na sociedade. Portanto, é fundamental desenvolver técnicas que possam mitigar vieses não intencionais em classificadores faciais. Assim, neste trabalho, apresentamos um novo método de aprendizado de máquina que combina rótulos subjetivos, baseados em humanos, e anotações objetivas, baseadas em definições matemáticas, de traços faciais. Especificamente, geramos novas anotações objetivas a partir de dois conjuntos de dados anotados por humanos em grande escala, cada um capturando uma perspectiva diferente do traço facial analisado. Em seguida, propomos um método de aprendizado em conjunto, que combina modelos individuais treinados em diferentes tipos de anotações. Fornecemos uma análise aprofundada do procedimento de anotação, bem como a distribuição dos conjuntos de dados. Além disso, demonstramos empiricamente que, ao incorporar a diversidade de rótulos, nosso método mitiga com sucesso vieses não intencionais, mantendo uma precisão significativa nas tarefas., Facial analysis models are increasingly applied in real-world applications that have significant impact on peoples’ lives. However, as previously shown, models that automatically classify facial attributes might exhibit algorithmic discrimination behavior with respect to protected groups, potentially posing negative impacts on individuals and society. It is therefore critical to develop techniques that can mitigate unintended biases in facial classifiers. Hence, in this work, we introduce a novel learning method that combines both subjective human-based labels and objective annotations based on mathematical definitions of facial traits. Specifically, our proposed method first generates new objective annotations, each capturing a different mathematical perspective of the analyzed facial traits. We then use an ensemble learning method, which combines individual models trained on different types of annotations. We provide an in-depth analysis of the annotation procedure as well as the datasets distribution. Moreover, we empirically demonstrate that, by incorporating label diversity to the decision-making process, our method successfully mitigates unintended biases, while maintaining significant accuracy on the downstream tasks.
Published: 2022

29. Evolutionary algorithms for learning ensembles of interpretable classifiers

Author: Barros, Rodrigo Coelho, Freitas, Alex A., Barros, Rodrigo Coelho, and Freitas, Alex A.
Abstract: Classificação é a tarefa de Aprendizado de Máquina que visa categorizar instâncias em classes. Existem diversos algoritmos na literatura que realizam classificação, com diferentes graus de sucesso. Nos últimos anos, o desempenho preditivo foi o objetivo priorizado entre praticantes de Aprendizado de Máquina e a comunidade acadêmica. Todavia, mais recentemente, interpretabilidade tem ganhado cada vez mais atenção. Uma área de aprendizado de máquina que pode se beneficiar de um ganho em interpretabilidade é a de ensemble learning. Ensemble learning visa reunir modelos que, quando agrupados em comitês, podem fornecer alto grau de desempenho preditivo, mesmo que os classificadores que façam parte do grupo não sejam (em média) muito melhores que preditores aleatórios. Doravante, os benefícios são duplos: ensembles podem melhorar o desempenho preditivo de modelos interpretáveis caixa branca (que são, em média, piores que modelos caixa preta); e o uso de modelos caixa-branca aumenta a interpretabilidade de ensembles. Nesta tese, através do projeto de algoritmos evolutivos, uma poderosa classe de algoritmos de soft computing, desenvolvemos dois métodos para aprendizado de ensembles interpretáveis: EDNEL e PUMA. Enquanto os dois métodos são semelhantes, a diferença entre eles ainda assim é significativa: PUMA aprende ensembles de classificadores sem levar a interação entre variáveis em consideração, enquanto EDNEL calcula a correlação das variáveis. Todavia, nos experimentos que conduzimos para avaliar o desempenho dos métodos, detectamos que a abordagem mais simples de PUMA gerou ensembles com melhor desempenho preditivo em média do que EDNEL, enquanto aquele é estatisticamente equivalente à dois bem-estabelecidos métodos de aprendizado de ensembles, Adaboost e Random Forests., Classification is the machine learning task of categorizing instances into classes. There are several algorithms in the literature that perform classification, with varying degrees of success. For the most part, predictive performance was the pursued objective among practitioners and the academic community regarding the design of novel classification algorithms. More recently, however, interpretability has been gaining more and more attention. One area of machine learning that can benefit from increased interpretability is that of ensemble learning. Ensemble learning aims to reunite models that, when ensembled, can provide a high degree of predictive performance, even though the individual classifiers of the ensemble are often not much better at predicting classes than random guessing. Hence, the benefits are twofold: ensembles can improve predictive performance of interpretable (white-box) models that perform, on average, worse than black-box models; and the use of white-box models improves the interpretability of ensembles. In this thesis, we design two evolutionary algorithms (a powerful soft computing technique) to develop two ensemble learning methods, EDNEL and PUMA. PUMA learns ensembles of classifiers in a univariate strategy, assuming independence among variables, while EDNEL takes into account variable dependence through correlation analysis. However, in the thorough experimental analysis performed, we found that PUMA performs better than EDNEL with regards to average rank, whilst it is statistically equivalent to two well-established ensemble learning algorithms, Adaboost and Random Forests.
Published: 2022

30. Proposal of many-core control through a management application

Author: Moraes, Fernando Gehm, Ruaro, Marcelo, Moraes, Fernando Gehm, and Ruaro, Marcelo
Abstract: A grande quantidade de cores em sistemas many-core introduziu desafios para gerenciá-los, incluindo escalabilidade, portabilidade e redução da interferência do gerenciamento sobre as aplicações em execução. Trabalhos disponíveis na literatura propõem um gerenciamento fortemente acoplado ao sistema operacional do many-core. Tal acoplamento implica em baixa flexibilidade para a modificação das organizações de gerenciamento, e baixa portabilidade. O estado-da-arte também mostra que poucos trabalhos propuseram organizações de gerenciamento, sendo que a maioria dos trabalhos se aproveitam de organizações presentes na literatura, como as baseadas em clusters e por aplicação, para avaliar a qualidade de uma única meta proposta, como, por exemplo, potência ou temperatura. O presente trabalho propõe uma organização de gerenciamento, denominada de Aplicação de Gerenciamento (MA), que é fracamente acoplada à sua plataforma alvo. A MA propõe um gerenciamento como uma aplicação distribuída, permitindo que a mesma se beneficie do poder de processamento paralelo intrínseco aos many-cores. Comparado a uma organização baseada em clusters, os custos e os benefícios em gerenciar um benchmark com restrições de tempo-real usando a MA revelam menor ocupação de memória e maior vazão de gerenciamento devido à paralelização provida pela MA. Esse trabalho também propõe uma heurística de mapeamento que separa virtualmente o espaço de busca em clusters para reduzir o custo de execução, mantendo uma visão centralizada do sistema. Essa heurística também conta com um procedimento de desfragmentação embutido. Resultados são avaliados contra uma heurística do estado-da-arte em gerenciamento baseado em clusters e por-aplicação, revelando redução na distância média entre tarefas comunicantes e tempo de execução da heurística similar à abordagem baseada em clusters.O arcabouço da MA é otimizado com a integração de uma rede intrachip baseada em broadcast, usada para troca de mensagens de gerenciamento, The increasing core count in many-core systems introduced management challenges, including scalability, portability, and reducing the management overhead to user applications. Works available in the literature have their management tightly coupled to the many-core operating system. This coupling implies low flexibility for modification of the management organizations and reduced portability. The state-of-the-art also shows that few works proposed management organizations, being that most works exploit organizations present in the literature, such as cluster-based and per-application, to evaluate the quality of a single goal, such as power or temperature. The present work proposes a management organization called Management Application (MA), which is loosely coupled to its target platform. MA proposes a management as a distributed application, benefiting from the parallel processing power intrinsic to many-cores. Compared to a cluster-based organization, the costs and benefits to manage a benchmark with real-time constraints using the MA revealed improved memory footprint and higher management throughput due to the parallelization provided by the MA. This work also proposes a mapping heuristic that virtually separates the search space in clusters to reduce the execution cost, keeping a centralized view of the system. This heuristic also has a built-in defragmentation procedure. Results are evaluated against a state-of-the-art heuristic in clustered and per-application management, revealing reduced distance between communicating tasks and similar heuristic execution time to the clustered approach.Defragmentation uses task migration as actuation means, decreasing the distance between communicating tasks using few migrations. The MA framework is optimized by integrating a broadcast-based network-on-chip, used for exchanging management messages, and a monitoring structure that exploits this network and the direct memory access mechanism to reduce the monitoring overhead.
Published: 2022

31. Interfaces de rede seguras para conexão de periféricos em MPSOCS

Author: Moraes, Fernando Gehm and Moraes, Fernando Gehm
Abstract: O aumento da complexidade em projetos de circuitos integrados (CIs) devido à quantidade de módulos de hardware pré-validados (em inglês, Intellectual Property - IPs) integrados em um mesmo System-on-Chip (SoC), motiva o desenvolvimento de arquiteturas de comunicação escaláveis, como Network-on-Chips (NoCs). Este modelo traz conceitos de redes de computadores, aplicações paralelas e distribuídas para o projeto de CIs. Módulos IPs são utilizados como forma de reduzir o custo de engenharia e tempo de projeto, sendo sua reutilização facilitada pela adoção de interfaces e protocolos padronizados.A possibilidade de executar aplicações de origens e perfis diferentes paralelamente em um Multiprocessor-System-on-Chip (MPSoC) torna-o suscetível a ataques de aplicações maliciosas, que podem se aproveitar do compartilhamento de recursos provido pela plataforma para extrair informações sensíveis ou impedir o seu funcionamento. Este trabalho revisa o estado-daarte em interfaces de rede seguras para NoCs, considerando um modelo de ameaças com os seguintes princípios de segurança: autenticação, integridade, não repúdio, confidencialidade, disponibilidade, autorização. O trabalho propõe uma interface de rede segura para MPSoC com o objetivo de abstrair o seu protocolo interno aos periféricos externos, permitindo a integração de IPs de terceiros como aceleradores de hardware, além de prover um controle de acesso aos periféricos comandado por parte do MPSoC, e também garantir a integridade e confidencialidade das mensagens provenientes de tarefas executando no MPSoC (em trânsito) durante a comunicação com periféricos externos e durante o armazenamento em memórias externas conectadas ao MPSoC.Como prova de conceito foi desenvolvida uma memória externa com interface e protocolo padronizado, integrada no MPSoC base Memphis juntamente com uma Application-Programming-Interface (API) desenvolvida no nível de kernel. A API implementa um esquema de alocação de recursos que permite controlar o, The increase in complexity in Integrated Circuits (ICs) designs due to the amount of prevalidated hardware modules (Intellectual Property - IPs) integrated into the same System-on- Chip (SoC) motivates the development of scalable communication models such as Networkson- Chip (NoCs). This model brings concepts of computer networks, parallel and distributed applications to IC projects. IP modules are used to reduce engineering costs and design time, and their reuse is facilitated by the adoption of standardized interfaces and protocols. The possibility of running applications from different sources and profiles in parallel in a Multiprocessor-System-on-Chip (MPSoC) makes it susceptible to attacks from malicious applications, which can use the resources sharing provided by the platform to extract information or prevent its functioning. This work reviews the state-of-the-art in security network interfaces for NoCs, considering a threat model with the following security principles: security, integrity, non-repudiation, confidentiality, availability, authorization.We propose a secure network interface (NI) for MPSoCs to abstract their internal protocol to external peripherals. This NI allows the integration of third-party IPs as hardware accelerators, in addition to providing access control for the peripherals connected to the MPSoC and also ensuring integrity and confidentiality of the messages coming from tasks running on it (in-transit) during the communication with external peripherals and during storage in memories connected to the MPSoC. As proof of concept, an external memory with a standardized interface and protocol was developed, integrated into the Memphis MPSoC, with the API developed at the kernel level. The API implements a resource allocation scheme that allows controlling access to peripherals and prevents the injection of forged packets into the network. We show through the experiments that it is possible to mitigate attacks arising from the execution of
Published: 2022

32. Análise visual do percurso acadêmico de estudantes ao longo do ensino superior

Author: Manssour, Isabel Harb and Manssour, Isabel Harb
Abstract: De acordo com o Censo da Educação Superior no Brasil, a evasão nos cursos de graduação é um problema que está piorando a cada ano nas instituições de ensino superior. Porém, uma análise constante e unificada do percurso do aluno pode ajudar a melhorar este cenário, auxiliando a entender ou prever quando não haverá a conclusão destes cursos. Entretanto, para isso, são necessárias ferramentas analíticas que facilitem estes acompanhamentos e viabilizem a tomada de decisões. Neste contexto, o presente trabalho propõe a criação de um modelo de visualização de dados que possibilite a análise do percurso acadêmico de um ou mais alunos durante o ensino superior. Através da exploração de dados e análise estatística, este modelo visa permitir a identificação de indivíduos, ou grupos de indivíduos, com tendência a não completarem seus cursos com sucesso, além de permitir uma “visão do todo” em relação ao seu percurso acadêmico e principais indicadores. Desta forma, busca auxiliar os tomadores de decisão das instituições de ensino (administradores, educadores, responsáveis técnicos, etc.), na condução de orientações, aplicação de políticas e outras ações, que minimizem as condições que levam estes alunos à evasão. O modelo proposto, centrado em uma visualização que utiliza diagrama de Sankey, conectado a um modelo de predição de evasão, e sua Implementação, foram baseados nos requisitos identificados a partir de uma revisão sistemática da literatura, da implementação de um protótipo e de entrevistas com quatro especialistas de domínio. A implementação do modelo também foi validada através de entrevistas com quatro especialistas de domínio, que a consideraram adequada à contribuir para a melhora do acompanhamento de progresso estudantil., According to the Census of Higher Education in Brazil, dropout in undergraduate courses is a problem getting worse every year in higher education institutions. However, constant and unified analysis of the student’s path can help improve this scenario, enabling understanding or predicting when these courses will not be completed. Nonetheless, analytical tools are needed to facilitate these follow-ups and make decision-making feasible. In this context, the present work proposes creating a data visualization model that allows the analysis of the academic path of one or more students during higher education. Through the exploration of data and statistical analysis, this model aims to identify individuals, or groups of individuals, with a tendency to not complete their courses successfully, in addition to allowing a “view of the whole” concerning their academic career and key indicators. In this way, it seeks to help decision-makers of educational institutions (administrators, educators, technical managers, etc.), in conducting guidelines, applying policies, and other actions, which minimize the conditions that lead these students to drop out. The proposed model, centered on a visualization that uses a Sankey diagram connected to an evasion prediction model, and its implementation, were based on the requirements identified from a systematic literature review, the implementation of a prototype, and interviews with four domain experts. The implementation of the model was also validated through interviews with four domain experts, who considered it adequate to contribute to the improvement of student progress monitoring.
Published: 2022

33. An empirical study about the impact of gender diversity in software development teams

Author: Prikladnicki, Rafael and Prikladnicki, Rafael
Abstract: A diversidade é um assunto amplamente discutido em diferentes áreas do conhecimento da sociedade. Estudos dizem que a diversidade torna as equipes melhores e oferece melhores resultados, mas também mostram que há preconceitos de gênero que afetam as decisões de contratação ou que as mulheres em Open Source, às vezes, têm menos probabilidade de ter seu código aceito. Discussões e pesquisas sobre diversidade na Engenharia de Software também têm apresentado resultados para tornar a área mais igualitária. No contexto da pesquisa empírica sobre os aspectos humanos e sociais da Engenharia de Software, utilizando uma abordagem construtivista, deseja-se compreender e descrever quais fatores nas equipes de desenvolvimento de software podem ser mais impactados pela diversidade de gênero. Realizamos duas revisões sistemáticas de mapeamento, um estudo de caso com 14 equipes de desenvolvimento de software e um Survey. A coleta de dados de profissionais da indústria de Engenharia de Software foi realizada utilizando diversas abordagens, permitindo realizar análises quantitativas e qualitativas. Dessa forma, esta pesquisa visa contribuir com a comunidade científica ao descrever o comportamento e desempenho das equipes de desenvolvimento de software em relação à diversidade de gênero, tendo como base, dados coletados em campo., Diversity is a subject that different areas of knowledge in society have widely discussed. Studies say that diverse teams deliver better results but also show that there are gender biases that impact hiring decisions or that women in Open Source are sometimes less likely to have their code accepted. Discussions and research on diversity in Software Engineering have also been presenting results to make the area more equalitarian. In the context of empirical research on human and social aspects of Software Engineering, using a constructivist approach, this research aims to understand and describe which factors in software development teams can be more impacted by gender diversity. We performed two systematic mapping reviews, a case study with 14 software development teams, and a survey. We collected data from practitioners in the Software Engineering industry in multiple ways, allowing us to perform quantitative and qualitative analysis. Thus, this research aims to contribute to the scientific community by describing the behavior and performance of software development teams related to gender diversity based on data collected in the field.
Published: 2022

34. Modeling an empathetic embodied conversational agent

Author: Musse, Soraia Raupp and Musse, Soraia Raupp
Abstract: A empatia pode ser vista como um comportamento sócio-emocional complexo, que é resultado da interação entre tanto dispositivos cognitivos como afetivos e é responsável pelo fato de uma pessoa ser capaz de identificar e imitar emoções de outras pessoas, por exemplo. Além disso, a memória humana é uma ferramenta poderosa que permite a cada pessoa armazenar e recuperar informações sobre quase tudo o que acontece em sua vida. Equipar um agente conversacional incorporado (ECAs) com a capacidade de empatia, assim como outros recursos como memória, podem ajudar a tornar a interação com seres humanos mais fácil e natural. Este trabalho tem como objetivo propor e construir um agente conversacional empático dotado de uma memória similar à humana. Além de poder conversar com uma pessoa, é também capaz de mostrar certa extensão de empatia por essa pessoa. Além disso, este modelo dota o agente virtual com algumas outras habilidades, como reconhecer a pessoa com quem está conversando pela face e armazenar/recuperar informações com base em um modelo de memória humana. Alguns experimentos foram realizados para coletar informações quantitativas e qualitativas, as quais mostram que o modelo proposto funciona como pretendido. Finalmente, alguns caminhos para futuros trabalhos também são apresentados, esclarecendo o que está planejado ser feito para melhorar a qualidade deste trabalho., Empathy can be seen as a complex socio-emotional behavior, which is a result from the interaction between both cognitive and affective devices and is responsible, for instance, for one person being able to identify and mimicry others emotion. Moreover, the human memory is a powerful tool which allows for each person to be able to store and retrieve information about almost everything that happens. Equipping an embodied conversational agent (ECAs) with the ability of empathy, as well other features like memory, can help to make the interaction with humans smoother and more natural. This work aims to propose and build an empathetic conversational agent endowed with a human-like memory. Besides being able to chat with a person, it is also able to show some extent of empathy by such person. Also, this model endow the virtual agent with a few other abilities, like recognizing the person it is talking to by its face and store/retrieve information based on a human memory model. Some experiments were conducted to gather both quantitative and qualitative information, which show that the proposed model works as intended. Finally, a few avenues for future work are also presented, elucidating what it is planned to do aiming to improve the quality of this work.
Published: 2022

35. On the understanding of the role of experimentation in technology-based startups

Author: Marczak, Sabrina dos Santos and Marczak, Sabrina dos Santos
Abstract: Startups de tecnologia surgem constantemente para tentar criar soluções inovadoras em ambientes de extrema incerteza e, por enfrentar inúmeros desafios, possuem altos índices de falência. Entre os principais desafios estão a escassez de recursos e falta de aderência do produto com as necessidades do mercado. Na tentativa de suavizar estes desafios surgem iniciativas como a Experimentação Contínua. Esta abordagem faz com que hipóteses sejam testadas de forma sistematizada, ajudando equipes a priorizar as entregas que agregam maior valor aos usuários. Neste contexto, esta dissertação apresenta uma revisão da literatura seguida de um estudo de campo onde se procurou identificar como a Experimentação Contínua está sendo adotada e como ela interfere no ciclo de desenvolvimento de software em startups de base tecnológica. Para tanto, foram entrevistados 16 membros de startups de base tecnológica de maneira semi-estruturada a fim de explorar e caracterizar papéis, processos, ferramentas, desafios, benefícios, entre outros. Os resultados coletados nas entrevistas foram confrontados com as informações encontradas na revisão da literatura para formular respostas às questões de pesquisa e propor trabalhos futuros para o tópico seguir sendo explorado. Sendo assim, o objetivo desta dissertação foi o de caracterizar o uso dessa abordagem em startups de base tecnológica, além de identificar desafios e benefícios percebidos por profissionais que atuam nesse cenário., Technology startups are constantly emerging, trying to create innovative solutions in environments of extreme uncertainty, and because they face numerous challenges, they have high failure rates. The scarcity of resources and the product’s lack of adherence to market needs are among the main challenges. In an attempt to alleviate these challenges, initiatives such as Continuous Experimentation arise. This approach supports systematical tests of hypotheses, helping teams prioritize deliveries that increase perceived value by the users. In this context, this thesis presents a literature review followed by a interview-based study that focused on identifying how Continuous Experimentation is being adopted and how it underlies software engineering activities throughout the product development cycle of technology-based startups. We conducted semi-structured interviews with 16 members of technology-based startups to explore and characterize roles, processes, tools, challenges, benefits, among others. Results were compared with the information found in the litera- ture review to formulate answers to the research questions and propose future work to fur- ther explore the topic. Thus, this thesis aimed to characterize the use of this approach in technology-based startups and identify challenges and benefits perceived by professionals working in this scenario.
Published: 2021

36. Using interactive agents to provide daily living assistance for visually impaired people

Author: Bordini, Rafael Heitor and Bordini, Rafael Heitor
Abstract: Ambient Intelligence (AmI) é considerado como uma visão futura da computação inteligente, onde as pessoas serão apoiadas pelo ambiente que habitam. Com base na AmI, as tecnologias Ambient Assisted Living (AAL) surgiram para ajudar a monitorar, auxiliar e promover um ambiente saudável. Essas tecnologias são uma excelente oportunidade para melhorar a vida das pessoas, principalmente aquelas que convivem com alguma deficiência ou doença, como os deficientes visuais, que são o foco desta tese. Nosso principal objetivo neste trabalho é determinar como as interfaces AmI podem se tornar mais adequadas para a interação com usuários com deficiência visual. Para isso, desenvolvemos uma abordagem baseada em um sistema multiagente, uma vez que AAL requer uma forma muito avançada de interação homem-computador, e os sistemas multiagente são adequados para o desenvolvimento de sistemas adaptativos complexos, especialmente os distribuídos e dinâmicos, como AmI. Nossa metodologia é baseada nas quatro etapas do processo de design interativo.Na primeira etapa, identificamos as necessidades de pessoas com deficiência visual, com base em survey e entrevistas com os usuários finais e especialistas do domínio. Na segunda etapa, criamos alternativas de design com base em duas investigações na literatura para identificar os recursos e diretrizes usados no design de AmI. Na terceira etapa, desenvolvemos uma abordagem para AAL que inclui um sistema multiagente interativo para auxiliar pessoas com deficiência visual em sua residência. Finalmente, na última etapa, avaliamos nossa abordagem com 7 especialistas em interação homem-computador e 7 usuários finais. Como resultado, determinamos que nossa abordagem possui elementos que permitem uma interação natural com os usuários, bem como identificamos e discutimos melhorias e novas funcionalidades para trabalhos futuros. Acreditamos que nossas descobertas podem apontar direções para construção de sistemas AmI de interação mais natural. Além disso, Ambient Intelligence (AmI) is considered as a future vision of intelligent computing, where people will be supported by the environment they inhabit. Based on AmI, the Ambient Assisted Living (AAL) technologies emerged to help monitor, assist, and promote a healthy environment. These technologies are an excellent opportunity to improve people’s lives, especially those who live with disabilities or illnesses, such as people who are visually impaired (PVI), who are the focus of this thesis. Our main objective in this work is to determine how AmI interfaces can be made more suitable for the interaction with users who are visually impaired. To do so, we developed an approach based on a multi-agent system, since AAL requires a very advanced form of human-computer interaction, and multi-agent systems are suitable for developing complex adaptive systems, especially distributed and dynamic ones, such as AmI. Our methodology is based on the four steps of the interactive design process. In the first step, we identify the needs of PVI, based on surveys and interviews with end-users and domain experts. In the second step, we create design alternatives based on two systematic literature reviews to identify the resources and guidelines used in ambient intelligence design.We then created the first design alternative based on the first and second steps, which we evaluated with a blind user. In the third step, we create an approach to AAL that includes an interactive multi-agent system to assist visually impaired people at home. Finally, in the last step, we evaluated our approach with 7 human-computer interaction specialists and 7 endusers. As a result, we determined that our approach has elements that allow for natural interaction with users, as well as we identified and discussed improvements and new features for future work. We believe that our findings can point to directions for building AmI systems that are capable of more natural interaction with users. Furthermore, with an
Published: 2021

37. Análise da relação entre doação, coleta, ocultação e acumulação do conhecimento e a dimensão relacional do capital social no contexto dos times de desenvolvimento de software

Author: Oliveira, Mírian and Oliveira, Mírian
Abstract: Apesar dos incentivos para o engajamento das pessoas ao compartilhamento do conhecimento, poucas empresas conseguem sua efetividade. Crucial para a gestão do conhecimento, esse processo continua problemático no contexto organizacional. Ocasionalmente, as pessoas optam por ocultar ou acumular o que sabem, prejudicando o desempenho individual e coletivo. Entre os fatores que podem influenciar essa decisão, o capital social tem potencial para impactar o fluxo do conhecimento. Nesse sentido, mediante a utilização de métodos mistos de investigação e à luz da Teoria do Capital Social e da Visão da Firma Baseada em Conhecimento, esta pesquisa analisou a relação entre variáveis de natureza social e comportamental no que tange ao compartilhamento do conhecimento entre indivíduos que atuam em times de desenvolvimento de software. Na primeira etapa, uma revisão sistemática da literatura foi realizada para consolidar a noção sobre ocultação e acumulação do conhecimento. A partir desse entendimento, desenvolveu-se uma investigação qualitativa e exploratória, pela qual 21 profissionais de tecnologia foram entrevistados. Ao analisar o conteúdo dessas entrevistas, foi possível identificar as principais facetas do capital social que influenciam a decisão de compartilhar ou reter o conhecimento. Segundo os participantes da pesquisa, as variáveis identidade, confiança e reciprocidade, inerentes à dimensão relacional do capital social, têm potencial para influenciar esse comportamento no contexto dos times de desenvolvimento de software. Embora questões na esfera individual e organizacional igualmente produzam impacto comportamental, a qualidade das relações interpessoais é crucial para o fluxo do conhecimento. Em contraste com o fenômeno da ocultação do conhecimento, o constructo acumulação do conhecimento não possuía uma escala validada e majoritariamente aceita em trabalhos anteriores que pudesse ser utilizada para mensurar esse comportamento. Desse modo, coletando dados quantitativ, Despite the incentives for engaging people to share knowledge, few companies achieve their effectiveness. Crucial for knowledge management, this process remains problematic in the organizational context. Occasionally, people choose to hide or accumulate what they know, undermining individual and collective performance. Among the factors that can influence this decision, social capital can potentially impact the flow of knowledge. In this sense, through mixed methods of investigation and in the light of Social Capital Theory and the Knowledge- Based Vision of the Firm, this research analyzed the relationship between social and behavioural variables regarding the sharing of knowledge between individuals with whom they work in software development teams. In the first step, a systematic literature review was carried out to consolidate the notion of concealment and accumulation of knowledge. Based on this understanding, a qualitative and exploratory investigation was developed, through which 21 technology professionals were interviewed. By analyzing the content of these interviews, it was possible to identify the main facets of social capital that influence the decision to share or retain knowledge. According to the research participants, the identity, trust and reciprocity variables, inherent to the relational dimension of social capital, can influence this behaviour in the context of software development teams. Although issues in the individual and organizational spheres equally have behavioural impacts, interpersonal relationships are crucial to the flow of knowledge. In contrast to the phenomenon of knowledge concealment, the knowledge accumulation construct did not have a validated scale that was mostly accepted in previous works that could be used to measure this behaviour. Thus, by collecting quantitative data among 217 undergraduate and graduate students, it was possible to validate an adapted scale for this type of knowledge retention. In the second stage, to mo
Published: 2021

38. High-level programming abstractions for distributed stream processing

Author: Fernandes, Luiz Gustavo Leão, Griebler, Dalvan Jair, Fernandes, Luiz Gustavo Leão, and Griebler, Dalvan Jair
Abstract: Aplicações de processamento de fluxo contínuo de dados (stream processing) representam uma parte significativa dos softwares atuais. Uma quantidade maior de dados é gerada todos os dias e de fontes variadas (através de dispositivos computacionais e aplicações), que requerem processamento em tempo hábil. Arquiteturas de memória compartilhada não conseguem atender demandas de processamento em larga escala. No contexto de computação de alta performance, a interface de programação MPI (Message Passing Interface) é considerada o estado da arte para implementar programas paralelos em C/C++. No entanto, a exploração de paralelismo de fluxo contínuo de dados usando MPI é difícil e sujeita a erros aos desenvolvedores de aplicação, pois ele expõe os detalhes de baixo nível das arquiteturas de computadores e sistemas operacionais. Os programadores precisam lidar com mecanismos de serialização de dados, comunicação entre processos, sincronização, tolerância a falhas, balanceamento de carga, escalonamento de trabalhos e estratégias de paralelismo. Este trabalho aborda um subconjunto desses problemas e desafios, oferecendo duas abstrações de alto-nível para processamento de fluxo contínuo de dados em arquiteturas de memória distribuída. Primeiramente, foi criada uma biblioteca de paralelismo de fluxo contínuo de dados nomeada de DSPARLIB. A biblioteca foi construída como uma biblioteca de esqueletos equipada com os padrões paralelos Farm e Pipeline, provendo abstrações acima do MPI. Depois, a linguagem SPAR foi estendida para suportar arquiteturas de memória distribuída, uma vez que ela é uma linguagem de domínio específico para expressar paralelismo de fluxo contínuo de dados usando anotações do C++11, que se mostram produtivas em arquiteturas de memória compartilhada.Este trabalho conseguiu estender o compilador e a linguagem SPAR sem alterar significativamente a sintaxe e a semântica, gerando código que usa DSPARLIB como ambiente de execução paralelo. Os experimentos foram con, Stream processing applications represent a significant part of today’s software. An increased amount of streaming data is generated every day from various sources (computing devices and applications), which requires to be processed on time. Shared-memory architectures cannot cope with these large-scale processing demands. In High-Performance Computing (HPC), Message Passing Interface (MPI) is the state-of-the-art parallel API (Application Programming Interface) for implementing parallel C/C++ programs. However, the stream parallelism exploitation using MPI is difficult and error-prone to application developers because it exposes low-level details to them, regarding computer architectures and operating systems. Programmers have to deal with implementation mechanisms for data serizalization, process communication and synchronization, fault tolerance, work scheduling, load balancing, and parallelism strategies. Our research work addresses a subset of these challenges and problems providing two high-level programming abstractions for distributed stream processing. First, we created a distributed stream parallelism library called DSPARLIB. It was built as a skeleton library equipped with Farm and Pipeline parallel patterns to provide programming abstractions on top of MPI. Second, we extend the SPAR language and compiler roles to support distributed memory architectures since it is a Domain-Specific Language (DSL) for expressing stream parallelism using C++11 annotation that has been proved to be productive on shared-memory architectures. We managed to make it work without significantly changing the easy of use language syntax and semantics, generating automatic parallel code with SPAR’s compiler using DSPARLIB as the parallel runtime. The experiments were conducted using real-world stream processing applications and testing different cluster configurations.We demonstrated that DSPARLIB provides a simpler API than MPI and a competitive performance. Also, the SPAR’s compi
Published: 2021

39. Convolutional neural networks compression for object detection

Author: Barros, Rodrigo Coelho and Barros, Rodrigo Coelho
Abstract: Aprendizado Profundo é o estado da arte em tarefas de Visão Computacional, tais como Classificação de Imagens, Detecção de Objetos, Segmentação de Instâncias, Geração de Conteúdo, entre outros. Ao longo do tempo, os modelos se tornaram maiores, mais profundos, e de maior acurácia, mas também super-parametrizados, pesados e lentos, dificultando o uso de tais modelos em automação de processos em dispositivos limitados, com poder de processamento reduzido, memória, ou energia. Consequentemente, a Compressão de Modelos emergiu na literatura para reduzir o tamanho do modelo e o custo de processamento o máximo possível, impactando o mínimo possível na performance do modelo na tarefa alvo. Embora existam muitos estudos de compressão de modelos na literatura versando sobre diferentes abordagens, existem poucos estudos trazendo comparações práticas entre diferentes abordagens, e nenhum deles com o foco em Detecção de Objetos. Portanto, este trabalho contribui à literatura ao comparar e explorar os trade-offs existentes entre Pruning, Knowledge Distillation (KD), Neural Architecture Search (NAS), e uma reconstrução de modelo baseada em convoluções eficientes. Para alcançar tal objetivo, modelos baseados na YOLOv3 foram treinados com a mesma estratégia de data-augmentation em dois conjuntos de dados, PASCAL VOC e Exclusively Dark Images, e avaliados de acordo com Mean Average Precision, número de parâmetros, tamanho de armazenamento, e Multiply-Accumulate Operation (MAC). Os resultados mostram que um Pruning mais agressivo foi capaz de gerar o melhor trade-off, onde o seu mAP ultrapassou a abordagem de NAS + KD, além de produzir um modelo com o menor número de parâmetros e com a maior redução efetiva em MACs., Deep Learning (DL) is the state-of-the-art in Computer Vision tasks, such as Image Classification, Object Detection, Instance Segmentation, Content Generation, among others. Over time, the models have become broader, deeper, and more accurate, but also hyperparameterized, heavier, and slower, making their use harder for automating tasks based on constrained devices, such as those with reduced processing power, or with memory or energy consumption constraints. Consequently, Model Compression emerges in the literature to reduce the model’s size and processing cost as much as possible, while impacting as little as possible in the model’s performance within its target task. Although there are many model compression studies in the literature exploring several different approaches, there are few studies in the literature bringing practical comparisons between different approaches and none of those focusing on Object Detection. Therefore, this work contributes to the literature by comparing and exploring the existing trade-offs between Pruning, Knowledge Distillation (KD), Neural Architecture Search (NAS), and a model reconstruction based on efficient convolutions. To achieve this goal, we train models based on YOLOv3 with the same data augmentation on two datasets, PASCAL VOC and Exclusively Dark Images, and we evaluate them according to Mean Average Precision, number of parameters, storage size, and Multiply-Accumulate Operations (MACs). Results show that a more aggressive Pruning was capable of generating the best trade-off: its mAP surpassed a NAS + KD approach, in addition to producing a model with the smallest number of parameters and with a most effective reduction in MACs.
Published: 2021

40. Extração de relação entre entidades nomeadas no contexto econômico-financeiro

Author: Manssour, Isabel Harb and Manssour, Isabel Harb
Abstract: Inteligência Competitiva (IC) é uma área relevante de uma corporação e pode apoiar a área estratégica de negócios, auxiliando os responsáveis pela tomada de decisões e como posicionar sua organização no mercado. No domínio financeiro, a identificação das organizações contidas em uma notícia pode se tornar insuficiente, sendo necessário extrair relações (ER) entre as entidades. Assim sendo, o objetivo deste trabalho é propor uma abordagem para a extração de qualquer relação semântica entre Entidades Nomeadas (ENs) no domínio do Mercado Financeiro para a língua portuguesa. Para atingir este objetivo, inicialmente foi feita uma revisão do estado da arte que levou à análise de 76 artigos para identificar as técnicas e conjuntos de dados usados para avaliá-las. Este estudo demonstrou que existem poucas abordagens para a tarefa de ER na língua portuguesa. Portanto, seguindo a metodologia de Knowledge Discovery in Databases (KDD) criada por Fayyad, propusemos uma abordagem em cinco etapas, que vai desde a coleta de dados até a avaliação dos resultados.Esta abordagem usa dois modelos baseados em Bidirectional Transformer Encoding Representations (BERT) para processar uma frase e suas entidades nomeadas. Primeiro classificamos se um determinado par de entidades tem ou não uma relação semântica e, em seguida, extraímos as partes da frase que representam ou descrevem a relação semântica entre essas entidades nomeadas. A abordagem foi desenvolvida para a língua portuguesa, considerando o domínio financeiro e explorando representações linguísticas profundas sem utilizar outros recursos léxico-semânticos. Os resultados dos experimentos mostram uma precisão de 76,3% usando a métrica de Jaccard, que mede a similaridade entre as relações extraídas pelo modelo extrator, além de alcançar pontuações de 87%, 84,5% e 85,8%, respectivamente para as métricas de Recall, Precisão e F-Measure quando mensuramos a abordagem completa. Outra contribuição importante é o corpus construído manualmen, Competitive Intelligence (CI) is a relevant area of a corporation and can support the strategic business area, helping those responsible for decision making and how to position your organization in the market. In the financial domain, identifying the organizations contained in a news story can become insufficient, and it is also necessary to extract relations (ER) between entities. Therefore, the main goal of this work is to propose an approach for the extraction of any semantic relation between Named Entities (NEs) in the Financial Market domain for the Portuguese language. To achieve this goal, a state-of-the-art review was initially carried out, which led to the analysis of 76 articles to identify techniques and datasets used to assess them. This study shows that there are readings for the RE task in Portuguese language. Therefore, following the methodology of Knowledge Discovery in Databases (KDD) created by Fayyad, we proposed a five-step approach, which goes from collecting data to evaluating the results.This approach uses two models based on Bidirectional Transformer Encoding Representations (BERT) to process a sentence and its named entities. We first classify whether or not a given pair of entities has a semantic relation and then extract the sentence parts representing or describing the semantic relation between these named entities. The approach was developed for the Portuguese language, considering the financial domain and exploring deep linguistic representations without using other lexical-semantic resources. The results of the experiments show an accuracy of 76.3% using the Jaccard metric, which measures the similarity between the relations extracted by the extractor model, in addition to achieving scores of 87%, 84.5% and 85.8%, respectively for the Recall, Precision and F-Measure metrics when assessing the complete approach. Another important contribution is the manually built corpus with more than 9,114 tuples (phrase, entity, entity) annotated fro
Published: 2021

41. USA-DSL process: a usability evaluation process for domain-specific languages

Author: Zorzo, Avelino Francisco, Silveira, Maicon Bernardino da, Zorzo, Avelino Francisco, and Silveira, Maicon Bernardino da
Abstract: Atualmente, existem diferentes Linguagens Específicas de Domínio (Domain-Specific Languages -DSL) que são criadas com o objetivo de resolver problemas em um domínio particular e não se destinam a resolver problemas fora de seu âmbito de atuação. De acordo com Fowleum a DSL é uma linguagem computacional focada em um domínio particular, no entanto sua expressividade está limitada a um domínio específico. Estas linguagens estão classificadas conforme sua forma de implementação, podendo ser internas, externas e gráficas. Sendo assim, a partir das diferentes aplicações e classificações das DSLs, uma preocupação tem sido pertinente: como avaliar a usabilidade das linguagens desenvolvidas. Quanto a avaliação destas linguagens ,pode-se encontrar diversos estudos experimentais avaliando subjetivamente usabilidade, mas poucos se apropriaram das técnicas específicas de Interação Humano-Computador (IHC). Sendo assim, busca-se com esta tese identificar o estado da arte no que se refere a processo de avaliação de usabilidade para DSL. Com base em um framework de avaliação de usabilidade para DSL e estudos encontrados na literatura, esta tese apresenta um processo de avaliação de usabilidade para DSLs, que destina-se a avaliação centrada no usuário., Currently, there are different Domain-Specific Languages (DSL) that are created to solve problems in a particular domain and are not intended to solve problems outside their scope. According to Fowler, a DSL is a computational language focused on a particular domain, however, its expressiveness is limited to that specific domain. These languages are classified according to their form of implementation and can be internal, external, and graphic. Thus, from the different applications and classifications of DSLs, a concern has been pertinent: the usability evaluation the developed languages. As for the evaluation of these languages, several experimental studies can be found subjectively evaluating usability, but few have appropriated the specific techniques of Human-Computer Interaction (IHC). Therefore, this thesis seeks to identify the state of the art regarding the usability evaluation process for DSL. Based on a framework of usability evaluation for DSL and the studies found in the literature, we developed a usability evaluation process for DSLs, which is user-centric.
Published: 2021

42. Visual analysis approach for brands perception on social media

Author: Manssour, Isabel Harb and Manssour, Isabel Harb
Abstract: Devido ao seu crescimento exponencial e sua rápida capacidade de prover feedback, as redes sociais tornaram-se importantes fontes de informação para diversas áreas. A grande quantidade de dados gerados diariamente fez das redes sociais fontes de dados confiáveis, rápidas e de baixo custo. Desta forma, as marcas perceberam que poderiam utilizá-las como ferramentas de marketing para obter um rápido retorno a respeito de seus produtos e serviços. Todavia, a análise uma marca através de suas redes sociais não é trivial e apresenta desafios tais como a coleta, análise, filtrage e organização dos dados. Para que a marca possa beneficiar-se dos dados obtidos através de redes sociais, é necessários o desenvolvimento de ferramentas que auxiliem no seu entendimento. Essas ferramentas devem ser de fácil utilização pelos gestores das marcas, sem que seja necessário noções de programação. Neste contexto, o objetivo deste trabalho é prover uma abordagem de análise visual interativa, composta por várias técnicas de visualização, que auxilie a marca a obter vantagem dos dados provenientes de três redes sociais: Twitter, Instagram e YouTube. Nossa abordagem provê um pipeline que pode ser facilmente atualizado, sem a necessidade de programar. Além disso, são apresentados três estudos de caso que demonstram a possibilidade de obter várias informações a respeito dos dados coletados através do uso da nossa abordagem., Due to the exponential growth and the quick feedback provided, Social Media has become an important information source for many areas. The thousands of data generated daily transformed Social Media into a reliable, fast, and relatively low-cost data source. So, brands note that they could use Social Media data as a marketing tool to obtain quick feedback about their products and services. However, analyzing a brand thru its Social Media is not a trivial task and raises challenges like data gathering and data analysis. To benefit from Social Media data, brands need tools that help them understand the vast amount of generated data. These tools need to be easy-to-use for brands managers that do not have programming knowledge. Thus, the objective of this work is to provide a visual analysis approach with several interactive visualization techniques to help brands obtain insights about the collected data from three social networks: Twitter, Instagram, and YouTube. Our approach provides a pipeline that can be easily extended and used without needing programming knowledge. Furthermore, three case studies are presented to demonstrate possible insights that can be identified using our approach.
Published: 2021

43. Geometric deep learning for functional neuroimaging analysis

Author: Meneguzzi, Felipe Rech and Meneguzzi, Felipe Rech
Abstract: O estudo do conectoma cerebral humano, um conjunto complexo de relações entre redes neurais cerebrais que associam estrutura cerebral e funcionalidade, têm recebido crescente interesse na área de neuroimagem ao longo da última década. Técnicas de aprendizado profundo constituem o estado da arte para tarefas de classificação de diferentes disordens neurológicas a partir de neuroimagens, proporcionando análises em profundidade acerca de características inerentes da atividade e conectividade cerebrais sem a necessidade prévia de seleção de features. No entanto, operações convolucionais de redes profundas tradicionais são aplicadas a regiões fixas de elementos durante o aprendizado, enquanto dados de conectoma cerebral são melhor representados na forma de grafos, com elementos espacialmente dispersos. Neste trabalho, fazemos uso de técnicas de aprendizado profundo geométrico para análise de dados de conectoma de imagens de ressonância magnética funcional (fMRI), buscando a identificação e extração de representações de características de alto nível das dinâmicas de redes cerebrais envolvidas na cognição humana. Nossas conclusões sugerem que as técnicas investigadas podem superar o estado da arte relativo a modelos de classificação de dados de fMRI além de possibilitar uma metodologia simples para análise de resultados., The study of the human brain connectome, a complex set of cerebral network relationships associating structure and functionality, has seen a growing interest in the field of neuroimaging over the last decade. Deep learning techniques constitute the state-ofthe- art for neuroimaging classification tasks on different neurological disorders, providing in-depth analysis into the inherent characteristics of brain activation and connectivity without the need for prior feature selection. However, convolutional operations of traditional deep networks affect fixed regions of elements during learning, whereas connectome data is best represented in the form of graphs, with spatially dispersed elements. We make use of geometric deep learning (GDL) for the analysis of whole-brain functional magnetic resonance imaging (fMRI) connectome data to identify and extract high-level feature representations of the cerebral network dynamics involved in human cognition. Our findings suggest that GDL techniques can outperform state-of-the-art models for classification of fMRI data while providing a simple framework for result analysis.
Published: 2021

44. Exploring curve-based prediction models for intra-frame prediction

Author: Marcon, César Augusto Missio, Agostini, Luciano Volcan, Marcon, César Augusto Missio, and Agostini, Luciano Volcan
Abstract: Esta Tese apresenta dois novos modelos de predição intra-quadros: LSAS (superfícies de aproximação baseadas em mínimos quadrados, em inglês Least-Squares Approximation Surfaces) e modelos de predição baseados em curvas. Ambas as abordagens aprimoram a predição intra-quadros, oferecendo uma melhor aproximação do conteúdo de bloco codificado. Embora o LSAS não seja prático devido aos requisitos proibitivos de taxa de bits, os modelos de predição baseados em curvas mostram resultados promissores. As avaliações dos novos modelos de predição intra-quadros adotam o padrão HEVC (codificação de vídeo de alta eficiência, em inglês High Efficiency Video Coding), que culmina anos de avanços em tecnologias de codificação de vídeo. Em comparação com seu antecessor H.264, o HEVC alcança até 50% de melhorias na eficiência de codificação. Isso se traduz em metade do tamanho de um vídeo codificado, mantendo a mesma qualidade visual. Entre as muitas melhorias do HEVC, o seu preditor intra-quadros vem com mais modos de predição, capazes de modelar mais texturas em blocos de predição do que seus antecessores. Melhorar a predição intra-quadros é um aspecto importante do fluxo de codificação, pois uma melhor predição se traduz em redução da energia residual, consequentemente melhorando a eficiência da codificação.Todos os trinta e três modos angulares do HEVC receberam um cálculo de deslocamento de curva para cada amostra predita para que a predição de blocos modele regiões de imagem com texturas curvas. A proposta inclui um pequeno custo adicional nos elementos de sintaxe do vídeo codificado, para incorporar o valor de deslocamento da curva, e um aumento no tempo de codificação. No entanto, a predição aprimorada compensa esse custo com uma maior eficiência de codificação. Utilizando os modelos baseados em curvas Centerline e Radial, para aplicar o cálculo de deslocamento, os resultados experimentais demonstram maior precisão da predição com menor energia residual, alcançando uma redução, This Thesis presents two novel intra-frame prediction models for video coding: Least-Squares Approximation Surfaces (LSAS) and curve-based prediction models. Both approaches enhance intra-frame prediction capabilities by offering a better approximation of encoded block contents. While the LSAS implementation is currently not practical due to its prohibitive bitrate requirements, the curve-based prediction models show promising results. The evaluations for the novel intra-frame prediction models adopt the High Efficiency Video Coding (HEVC) standard, which culminates years of advancements in video coding technologies. Compared to its predecessor, H.264, HEVC achieves up to 50% coding efficiency improvements. This efficiency gain translates into half the encoded video size while keeping the same visual quality. Among the many improvements of HEVC, its intra-frame predictor comes with more prediction modes, capable of modeling more textures in prediction blocks than its predecessors. Improving intra-frame prediction is an essential aspect of the encoding flow, as a better prediction translates into reduced residual energy, consequently improving coding efficiency. All thirty-three angular modes in HEVC received a curve displacement calculation to each predicted sample so that the resulting prediction block models image regions with curved textures.The proposal includes a small overhead in the bitstream syntax elements to transmit the curve displacement value and increased encoding times. However, the enhanced prediction offsets this overhead with improved coding efficiency. The experimental results demonstrate increased prediction accuracy with lower residual energy when applying the Centerline and Radial curve-based models for the displacement calculations. These models achieve an average reduction of the Bjøntegaard-Delta bitrate (BD-Rate) of 2% and 3% for the HEVC test sequences using the All-Intra-8 configuration, for the Centerline and Radial models, respectively
Published: 2021

45. Imagery contents descriptions for people with visual impairments

Author: Ruiz, Duncan Dubugras Alcoba, Silveira, Milene Selbach, Ruiz, Duncan Dubugras Alcoba, and Silveira, Milene Selbach
Abstract: Descrições de imagens visam expressar, em palavras, o conteúdo visual e são essenciais para pessoas que não têm visão. Tais sentenças descritivas são geradas manualmente ou por modelos de Inteligência Artificial (IA). Apesar da sua relevância, a emergência de geradores de descrições automáticas não foi motivada por pessoas com deficiência visual. Portanto, elas ainda causam insatisfação em sua audiência. Neste estudo, nós investigamos problemas em descrições de imagens na literatura por meio da técnica de Snowballing, onde encontramos treze problemas, incluindo aqueles relacionados à Ética, tais como a aparência física, gênero e identidade, raça e deficiência. Nós identificamos cinco razões do porquê pessoas videntes não escrevem descrições para os conteúdos visuais, demonstrando a necessidade de campanhas de acessibilidade para conscientizá-las da importância social das descrições de imagens. Além disso, nós realizamos um conjunto de entrevistas com oito participantes com baixa visão. Nós exploramos as características das sentenças descritivas de 25 imagens de ambientes internos e coletamos as expectativas de descrições de imagens dos participantes. Portanto, através dos resultados do Snowballing e das entrevistas, nós propomos um conjunto de Boas Práticas para auxiliar as ferramentas automáticas e as pessoas videntes na escrita de descrições de imagens de mais satisfatórias e de qualidade. Nós esperamos que os nossos resultados ressaltem a relevância social de sentenças descritivas e encorajam a comunidade a prosseguir com pesquisas interdisciplinares que possam potencialmente minimizar os problemas encontrados no nosso estudo., Image descriptions intend to express, in words, the visual content and are essential for people who do not have eyesight. Such descriptive sentences are generated manually or by Artificial Intelligence (AI) models. Despite its relevance, the emergence of automatic description generators was not motivated by people with visual impairments; thus, they still cause dissatisfaction in their audience. In this study, we investigate image descriptions issues reported in the literature through the Snowballing technique, where we found thirteen problems, including those related to Ethics, such as physical appearance, gender and identity, race, and disability. We have identified five reasons why sighted people do not write descriptions for visual content, raising the need for accessibility campaigns to make them aware of the social importance of image descriptions. In addition, we conducted a set of interviews with eight low vision participants. We explored the characteristics of the descriptive sentences of 25 indoor images and collected the participants’ expectations of image descriptions. Therefore, through the results of the Snowballing and the interviews, we propose a set of Best Practices to help automatic tools and sighted people in writing more satisfactory and quality descriptive sentences. We hope our results will highlight the social relevance of image descriptions and encourage the community to pursue further interdisciplinary researches that could potentially minimize the issues encountered in our study.
Published: 2021

46. Self-attention for improving the differentiable rendering pipeline in image 3d reconstruction

Author: Barros, Rodrigo Coelho and Barros, Rodrigo Coelho
Abstract: Pesquisas recentes sobre modelos de Renderizacao Diferenciavel relacionados a reconstrucao 3D de imagens utilizam modelos totalmente convolucionais para extracao de features ou para o processamento de decodificacao. Por outro lado, varias tarefas de visão computacional como reconhecimento visual, segmentacao, geracao de imagens e detecção de objetos tiveram grande melhoria de desempenho ao fazer uso de modelos baseados em self-attention, conhecidos tradicionalmente como Transformers. Devido a tal sucesso, neste trabalho pretendemos explorar quatro diferentes abordagens de modelos baseados em selfattention para reconstrucao implicita de objetos 3D. Em nossa primeira abordagem, implementamos as camadas de self-attention da SAGAN junto as camadas convolucionais; em nossa segunda abordagem, implementamos o modelo patchwise self-attention para substituir completamente o codificador convolucional. Em seguida, implementamos um modelo de Transformer chamado Pyramid Vision Transformer para substituir o codificador convolucional do modelo DVR; finalmente, em nossa quarta abordagem, implementamos o modelo Nystromformer como um otimizador para reduzir o custo computacional e para melhorar a capacidade de extracao de features. Considerando todas as abordagens, nossos resultados mostraram que podemos alcancar resultados competitivos usando Transformers, bem como adicionando um otimizador para reduzir seu custo computacional. Com a aplicacao do modelo de otimizacao e consequente reducao do custo computacional, foi possivel modificar o modulo referente ao decodificador de forma a melhorar os resultados de reconstrucao, alcancando melhorias de ate 8,5% em relacao aos baselines., Recent studies on Differentiable Rendering models related to 3D reconstruction focus on fully convolutional-based models for data feature extraction or for the decoding process. On the other hand, computer vision tasks such as image recognition, segmentation, image generation, and object detection is benefiting largely from using fully self-attention approaches known as Transformers. Due to the recent success of the Transformer backbone models applied to computer vision, in this work we aim to explore four different approaches of self-attention-based models for implicit 3D object reconstruction from images. In our first approach, we have implemented the SAGAN Self-Attention layers together with convolutions layers; in our second approach, we have implemented a patchwise self-attention model to completely replace the convolutional encoder; next, we have implemented a Transformer model called Pyramid Vision Transformer to replace the convolutional based encoder from the DVR model; finally, we have implemented the Nystromformer model, an optimizer to reduce the computational cost and to improve the feature extracting capability. Considering all approaches, our results have shown that we can achieve competitive results by using Transformer models, as well as adding an optimizer to reduce the computational cost. By applying the optimization model and reducing the computational cost, it was possible to modify the decoder module to increase the reconstruction results, resulting in improvements of up to 8.5% compared to the baseline approaches.
Published: 2021

47. Multi-level consensus algorithm for appendable-block blokchains in iot environments

Author: Zorzo, Avelino Francisco and Zorzo, Avelino Francisco
Abstract: Atualmente, diferentes dispositivos coletam dados e prestam serviços na Internet. Alguns desses dispositivos - ou apenas coisas - colaboram para trocar informações e usá-las para tomar decisões mais inteligentes em um ambiente chamado Internet das Coisas (IoT - Internet of Things). A possibilidade de conectar objetos físicos do dia a dia está criando novos modelos de negócios, melhorando processos e reduzindo custos. No entanto, os problemas de segurança em IoT podem ter um alto impacto nos ativos físicos e corporativos. Recentemente, a tecnologia blockchain surgiu como uma possível solução para superar problemas de segurança em IoT. Apesar disso, as blockchains tradicionais (como o Bitcoin e Ethereum) não são adequadas para a natureza de recursos restritos dos dispositivos de IoT ou para o grande volume de informações produzidos em ambientes de IoT típicos. A adoção de uma estrutura de blockchain leve chamada appendable-block blockchain foi proposta para ser usada em ambientes IoT. Esta blockchain adota uma estrutura de dados diferente, baseada em blocos com dados desacoplados e anexáveis. Embora esta blockchain tenha apresentado bons resultados de desempenho (alguns milissegundos para acrescentar um novo bloco), a falta de um algoritmo de consenso o torna vulnerável a muitos problemas de segurança.Outro problema nas implementações atuais de blockchain é a falta de discussão sobre o comportamento dos usuários em diferentes contextos e como elas poderiam ser adaptadas para diferentes algoritmos de consenso. Para superar esse problema, esta tese apresenta um conjunto de etapas para criar um mecanismo de consenso multinível para diferentes contextos. A ideia principal é desenvolver uma solução que permita o uso de algoritmos de consenso no nível dos blocos e no nível das transações. Além disso, esta solução pode ajudar a paralelizar a inserção de informações que separando os nós em contextos. Essa abordagem pode ajudar a fornecer uma solução que pode usar diferentes c, Currently, there are different devices collecting data and providing services through the Internet. Some of these devices - or just things - collaborate to exchange information and use them to make smarter decisions in an environment called Internet of Things (IoT). Connecting everyday physical objects is creating new business models, improving processes and reducing costs. However, security issues in IoT can have a high impact on both business and physical assets. Recently, the blockchain technology emerged as a possible solution to overcome security issues in IoT. Despite of that, traditional blockchains (such as Bitcoin or Ethereum) are not well suited to the resource-constrained nature of IoT devices or to the large volume of information expected from typical IoT environments. The adoption of a lightweight blockchain framework called appendable-block blockchain has been proposed to be used in IoT environments. This blockchain adopts a different data structure, based on blocks with decoupled and appendable data. While this blockchain presented good performance results (few milliseconds to append a new block), the lack of a consensus algorithm makes it vulnerable to many security issues. Another problem in current blockchain implementations is the lack of discussion on users behavior in different contexts and how it could be adapted for different consensus algorithms.To overcome this problem, this thesis presents a set of steps to create a multi-level consensus mechanism for different contexts. The main idea is to develop a solution that allows the usage of consensus algorithms at the block level and at the transaction level. Moreover, this solution can help to insertion of information in parallel, separating nodes in contexts. This approach can help to provide a solution that can use different configurations or consensus, according to the requirements of each context in the IoT environment. Finally, the results obtained in the experiments shows that a multi-level
Published: 2021

48. Task scheduling and security for edge devices in internet of things applications

Author: Hessel, Fabiano Passuelo and Hessel, Fabiano Passuelo
Abstract: A evolução da Internet das Coisas, Internet of Things (IoT), e a grande quantidade de dados que tem sido trocada entre os dispositivos e a nuvem nos levaram ao paradigma chamado Edge Computing, ou computação de borda. Ele permite a migração da computação da nuvem para a borda da rede e pode proporcionar latência baixa e previsível para usuários finais e aplicações, serviços de segurança e de preservação da privacidade, baixo custo de largura de banda, entre outros. Contudo, novos desafios têm surgido nos dispositivos de borda. Primeiro, a descentralização das aplicações da IoT para a borda da rede torna os dispositivos mais visíveis a ataques, principalmente os dispositivos de borda com limitações de recursos que não suportam mecanismos complexos de segurança devido às suas características. Segundo, os dispositivos de borda geralmente constituem aplicações de baixa latência e de computação intensiva da IoT. Dados gerados por esses dispositivos só são úteis se puderem ser processados de acordo com os requisitos de Qualidade de Serviço, Quality of Service (QoS), da aplicação. Entretanto, existem vários cenários da Internet das Coisas em que a quantidade de dados ou o tempo de processamento pode ser maior do que o habitual, como durante momentos de pico em aplicações de baixa latência, o que pode resultar na perda de prazos de dados. Nesse sentido, este trabalho apresenta duas principais contribuições. Primeiro, a definição de uma arquitetura de segurança leve para dispositivos de borda com recursos limitados. A arquitetura de segurança é baseada na integração de um hypervisor leve e mecanismos de confiança. Segundo, a definição de um mecanismo de alocação e escalonamento de tarefas para reduzir o número de tarefas que são processadas depois do seu respectivo prazo durante momentos de pico em aplicações de baixa latência da Internet das coisas., The evolution of the Internet of Things (IoT) and the large amount of data that has been exchanged between devices and the Cloud have pushed the horizon to the Edge computing paradigm. It enables the moving of IoT computation from the high-powered central Cloud to the edge of the network. The benefits of Edge computing result from its proximity to data sources and end-users. It allows low and predictable latency for end-users and applications, secure and privacy-preserving services, low bandwidth cost, among others. However, edge computing also brings new challenges to edge devices. First, the decentralization of IoT applications to the edge made the devices more visible to attacks, especially resource-constrained edge devices that do not support complex security mechanisms due to their characteristics. Second, edge devices are usually part of low-latency and computeintensive applications. Thus, the data generated are only useful if they can be processed following the Quality of Service (QoS) requirements of the application. However, there are several IoT scenarios where the amount of data may be greater or the processing time may take longer than usual, like during peak times, which may result in loss of data deadlines. In this sense, this work presents two main contributions. First, the definition of a lightweight security architecture for resource-constrained edge devices. The security architecture is based on the integration of a lightweight hypervisor and trust mechanisms. Second, the definition of a task assignment and scheduling mechanism to reduce the number of tasks’ deadline violations during peak times in low-latency IoT applications.
Published: 2021

49. Multi-level modeling of urban environments

Author: Cassol, Vinícius Jurinic, Musse, Soraia Raupp, Cassol, Vinícius Jurinic, and Musse, Soraia Raupp
Abstract: A modelagem e visualização de cidades virtuais tem sido um ponto de interesse nas áreas de pesquisa de simulações e computação gráfica, também apresentando contribuições para a indústria de filmes e jogos digitais. Cidades apresentam comportamentos populacionais complexos, com densas redes de estradas e um grande número de edificações com arquiteturas variadas. Nos últimos anos, diversos métodos baseados em dados geográficos e técnicas procedurais foram apresentados, permitindo a criação de conteúdos em larga escala. Ainda assim, esta área de pesquisa apresenta desafios a serem explorados, incluindo a falta de padrões de comunicação e troca de dados entre os diferentes níveis da hierarquia de uma cidade. Este trabalho apresenta um framework para modelagem multinível de ambientes urbanos. Em cada estágio do pipeline deste framework, novos elementos e áreas de uma cidade são representados em maior detalhe. Como contribuição, modelamos uma cidade do mundo real em um ambiente virtual com base em informações geográficas seguindo o modelo apresentado, permitindo sua representação em diferentes níveis de abstração e detalhamento de dados relacionados à população e aos elementos do ambiente. Realizamos uma análise dos dados de isolamento social da cidade, observando padrões de movimentação populacional durante a pandemia do COVID-19. Por fim, modelamos rotinas populacionais com base nos dados analisados, permitindo a visualização de grupos populacionais e indivíduos no ambiente virtual., The modeling and visualization of virtual cities is a point of interest in the research fields of simulations and computer graphics, also presenting contributions for the movies and games industries. Cities present complex population behaviors, with dense road networks and a huge number of buildings with varying architecture. In recent years, many methods based on geographical data and procedural techniques were presented, allowing the creation of content on a large scale. Still, there are known challenges to be explored in this field of research, including the lack of standards of communication and exchange of data between different levels in the hierarchy of a city. This work presents a framework for multi-level modeling of urban environments. At each stage of the framework’s pipeline, various elements and areas of a city are represented with increasing degrees of information. We modeled a real-world city based on geographical information following the presented framework, allowing its representation in different levels of abstraction and detail of data related to the population and environmental elements. We performed an analysis of social isolation data of the city, observing patterns in the population movement during the COVID-19 pandemic. Also, we modeled population routines based on the analyzed data, allowing the visualization of population groups and individuals in the environment.
Published: 2021

50. Self-supervised imitation learning from observation

Author: Barros, Rodrigo Coelho and Barros, Rodrigo Coelho
Abstract: Os seres humanos têm a capacidade de aprender através da observação. O equivalente computacional deste aprendizado se chama clonagem de comportamento, uma técnica de aprendizado por imitação na qual um agente estuda o comportamento de um especialista. Abordagens recentes trabalham no uso de dados não rotulados com representações fidedignas dos estados, decodificando as informações observadas em ações de maneira auto-supervisionada. No entanto, ainda existem vários problemas a serem resolvidos, incluindo problemas de mínimos locais e dependência de vetores de estados. Nesta dissertação, apresentamos três novos métodos de aprendizado por imitação: Augmented Behavioral Cloning from Observation, Imitating Unknown Policies via Exploration, e Combined Reinforcement and Imitation Learning, que têm por objetivo resolver os problemas de decaimento de aprendizado durante o processo iterativo, de falta de políticas não-exploratórias, e de fraca eficiência de amostragem durante o treinamento dos agentes. Os resultados de Augmented Behavioral Cloning from Observations mostram que um mecanismo de amostragem pode criar ciclos de aprendizagem iterativos mais apropriados. Já os experimentos com Imitating Unknown Policies via Exploration ressaltam que um mecanismo de exploração pode alcançar resultados superiores do especialista e bater o estado da arte. Por fim, a análise do framework de Combined Reinforcement and Imitation Learning, mostra que adicionar um mecanismo de aprendizagem por reforço pode criar políticas mais eficientes e chegar a resultados semelhantes ao segundo método, mas com muito menos amostras. O segundo e o terceiro métodos oferecem diferentes trade-offs entre desempenho e eficiência, dependendo da dificuldade de aquisição de amostras especializadas., Humans have the ability to learn through observation. The computational equivalent of learning by observation is behavioral cloning, an imitation learning technique that teaches an agent how to behave through expert demonstrations. Recent approaches work towards making use of unlabeled data with fully-observable snapshots of the states, decoding the observed information into actions in a self-supervised fashion. However, there are several problems still left to be addressed, including the many times the iterative learning scheme gets stuck into bad local minima. In this work, we propose three different methods, Augmented Behavioral Cloning from Observation, Imitating Unknown Policies via Exploration, and Combined Reinforcement and Imitation Learning, which aim to solve the problems of the decaying learning process, nonexplorative policies, and sample efficiency during the iterative process. The results from Augmented Behavioral Cloning from Observations show that a sampling mechanism can create more appropriate iterative learning cycles, while Imitating Unknown Policies via Exploration results convey that an exploration strategy can achieve results even better than the expert, reaching the state-of-the-art of the task. Lastly, the Combined Reinforcement and Imitation Learning framework shows that adding a reinforcement learning method within the imitation learning framework can create more efficient policies and reach similar results to the second method with fewer samples. Both the second and the third methods offer distinct trade-offs between performance and efficiency, depending on the difficulty of acquiring expert samples.
Published: 2021

Catalog

Books, media, physical & digital resources

See catalog results

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Publication Year Range

Publication Type

Database

2,550 results on '"informática"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources