Orientador: Romis Ribeiro de Faissol Attux Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação Resumo: Neste trabalho utilizamos redes neurais profundas (DNNs, deep neural networks) para reconhecimento de imagens nos contextos de interfaces cérebro-computador (BCIs, brain-computer interfaces) e detecção de COVID-19. Com BCIs, classificamos sinais de eletroencefalografia (EEG) em uma interface de um canal, baseada em Potenciais Visualmente Evocados em Regime Estacionário, a qual não requer calibração no usuário final. Convertemos sinais de EEG em espectrogramas e utilizamos transfer learning. Modificamos e aplicamos uma técnica de data augmentation, SpecAugment, criada para reconhecimento de fala. Alcançamos 82,2% de acurácia de teste média e F1-Score média de 0,825 usando o eletrodo Oz e sinais de 0,5 segundos. Nesta configuração, nossa DNN superou FBCCA e SVMs. O uso de transfer learning não melhorou as acurácias, mas deixou o treinamento mais rápido. SpecAugment criou um pequeno aumento de acurácia e pode ser combinada com janelamento para gerar melhor performance. No nosso estudo com COVID-19, classificamos raios-X torácicos como COVID-19, pneumonia ou normal, utilizando redes neurais densas (DenseNets). Utilizamos transfer learning duplo, treinando as redes em três bases de dados, ImageNet, NIH ChestX-ray14 e então o dataset de COVID-19. Nós propusemos uma mudança na técnica de transfer learning duplo, a qual chamamos de output neuron keeping (ONK), que se baseia na manutenção de neurônios de saída treinados. Atingimos 100% de acurácia de teste e constatamos que transfer learning duplo e ONK melhoraram performances, principalmente no início do treinamento. Analisamos as redes com Layer-wise Relevance Propagation (LRP), que gerou mapas de calor, os quais indicaram que palavras nos raios-X podem influenciar os classificadores. Entretanto, descobrimos que essa influência pouco mudava a acurácia. Na última parte de nosso trabalho, estudamos como bases de dados pequenas e mistas, como as disponíveis na época deste estudo, poderiam afetar a generalização de redes neurais, e como isso poderia ser melhorado com segmentação de pulmões. Treinamos uma DenseNet e uma DNN empilhada (formada por uma U-Net, um módulo intermediário original e uma DenseNet) que realiza segmentação e classificação. Novamente, classificamos raios-X torácicos como COVID-19, pneumonia ou normal. Avaliamos as redes utilizando um dataset externo (criado em localizações distintas). Com inferência Bayesiana estimamos distribuições de probabilidades de métricas de performance. A rede empilhada alcançou uma AUC de teste de 0,917, e a rede sem segmentação, 0,906. Com segmentação, inferência Bayesiana indicou acurácia média de teste de 76,1%, com HDI de 95% (intervalo em que se encontra 95% da massa de probabilidade) de [0,695, 0,826], e, sem segmentação, de 71,7% e [0,646, 0,786]. Comparamos mapas de calor criados com LRP com raios-X avaliados por radiologistas com a pontuação de Brixia. Isso indicou que áreas nas quais os radiologistas encontraram fortes sintomas de COVID-19 também eram aquelas que mais tinham influenciado a rede empilhada. Validação externa indicou acurácias menores que interna, mostrando a existência de viés do conjunto de dados, que é diminuído com segmentação. Nossas performances no dataset externo mostram que redes neurais podem ser treinadas em databases pequenas e mistas e ainda sim detectarem COVID-19. Porém, uma base grande, aberta e de boa qualidade seria muito benéfica Abstract: In this work, we utilized deep neural networks (DNNs) for image recognition in two problems: brain-computer interface (BCI) classification and COVID-19 detection. In the context of BCI, we proposed new strategies for classifying electroencephalography (EEG) signals in a single-channel BCI based on steady-state visually evoked potentials (SSVEP). Our BCI did not require calibration by the final user. We converted the EEG signals to spectrograms and used transfer learning. We modified and applied SpecAugment, a data augmentation technique, originally created for speech recognition. We reached 82.2% mean test accuracy and 0.825 mean F1-Score, using the Oz electrode and a small data window length (0.5 s). In this configuration, our DNN surpassed FBCCA and SVMs. Transfer learning did not improve accuracies, but made training faster, while SpecAugment created a small performance increase and could be successfully combined with window slicing to create higher accuracies. In the first part of our COVID-19 detection study, we utilized dense convolutional networks (DenseNets) and transfer learning to classify chest X-rays as COVID-19, pneumonia or normal. We applied twice transfer learning, training the networks on three datasets, ImageNet, NIH ChestX-ray14 and then the COVID-19 database. We proposed a novel modification to twice transfer learning, output neuron keeping (ONK), which is based on keeping trained neurons of the output layer. We achieved 100% test accuracy, twice transfer learning and output neuron keeping improved performances, mainly in the beginning of the training process. We analyzed the networks with Layer-wise Relevance Propagation (LRP), which generated heatmaps, showing that words on the X-rays can influence the classifiers. But we discovered that this influence only slightly changed accuracy. In the last part of our work, we studied how the utilization of small and mixed datasets, like the ones available at the time of this study, could affect generalization, and if lung segmentation could improve it. We trained a dense neural network and a stacked DNN, composed of a U-Net (for segmentation), an original intermediate module and a DenseNet (for classification). Again, we classified chest X-rays as pneumonia, normal or COVID-19. To understand the generalization capability, we evaluated the networks on an external dataset (from distinct localities) and used Bayesian inference to estimate the probability distributions of performance metrics. The stacked DNN achieved 0.917 test AUC, and the DenseNet, 0.906. With segmentation, Bayesian inference indicated a mean test accuracy of 76.1% and [0.695, 0.826] 95% high density interval (HDI, an interval with 95% of the probability mass) with segmentation and, 71.7% and [0.646, 0.786] without it. We also proposed a novel DNN evaluation technique, comparing LRP heatmaps with COVID-19 X-rays analyzed by radiologists with the Brixia score. It indicated that areas where radiologists found stronger symptoms of COVID-19 were also the most important for the stacked DNN classification. External validation showed smaller accuracies than internal validation, indicating dataset bias, which is reduced by segmentation. Our results indicate that DNNs can be trained in small and mixed datasets and still detect COVID-19, but a large, high quality and open database would be highly beneficial Mestrado Engenharia de Computação Mestre em Engenharia Elétrica CAPES 001