Orientadores: Plinio Almeida Barbosa, Anders Eriksson Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem Resumo: A pesquisa desenvolvida na presente tese voltou-se para a análise multiparamétrica de medidas fonético-acústicas entre sujeitos geneticamente relacionados, i.e., gêmeos idênticos, e sujeitos não-geneticamente relacionados, i.e., comparações entre pares. De um modo geral, buscou-se responder a seguinte pergunta: "quais parâmetros fonético-acústicos e dimensões de análise são considerados notadamente discriminatórios em comparações realizadas entre indivíduos geneticamente relacionados e entre todos os falantes da pesquisa, e portanto, potencialmente relevante para a aplicação forense?''. Parâmetros pertencentes a três diferentes dimensões fonético-acústicas foram analisados, a saber: frequências de formantes vocálicos (espectral), medidas temporais (temporal) e descritores da frequência fundamental (melódica), resultando em um total de 30 parâmetros fonético-acústicos analisados. Os participantes da pesquisa foram 20 sujeitos, dez pares de gêmeos idênticos do sexo masculino, falantes do Português Brasileiro (PB) da mesma área dialetal, com idades entre 19 e 35 anos. O material de fala consistiu em conversas telefônicas espontâneas entre gêmeos, a partir de temas elencados pelos pares. Em relação aos resultados, as evidências sugerem frequências de formantes mais elevados, e.g., F3 e F4, como potencialmente mais discriminatórias em relação às frequências de formantes mais baixos, como sugerido pela maior proporção de diferenças entre falantes e a análise do tamanho do efeito. Contuto, dentre todas as medidas, F3 apresentou as propriedades desejadas expressas pela combinação de menores valores de Cllr/EER, compatível com maior acurácia, e altos valores de AUC, compatível com um alto potencial discriminatório. Em relação à qualidade da vogal, a vogal central baixa [a] e as vogais anteriores revelaram-se mais discriminatórias quando comparadas às vogais posteriores. Tais segmentos apresentaram também maiores distâncias euclidianas entre si, convidando a hipótese de uma possível relação entre a dispersão fonético-acústica das vogais e o nível de variação fonética admitido. Ademais, embora vogais tônicas tenham apresentado uma maior proporção de diferenças entre sujeitos, a combinação de vogais tônicas e átonas, mostrou-se, em geral, mais discriminatória dos falantes. Em se tratando de parâmetros temporais, as evidências sugerem a categoria de parâmetros macro-temporais, e.g., taxa de elocução e taxa de articulação, como mais discriminatórios e consistentes em condições de fala espontânea/não-controlada. Além disso, a análise de medidas temporais em gêmeos idênticos revelou um grau considerável de semelhanças intra-par, substancialmente mais elevado do que o observado para parâmetros não-temporais. Alguns fatores explicativos, incluindo a sobreposição dos fatores "entrelaçamento prosódico'' e "padrões/representações temporais compartilhados'' foram sugeridos para explicar tal convergência. Quanto aos descritores de f0, a baseline, mediana, média, e valores extremos de f0 apresentaram as maiores proporções de diferenças intra-gêmeos e entre todos os sujeitos, acompanhadas de maiores tamanhos do efeito. Contrariamente, medidas de variação e modulação de f0 mostraram-se relativamente menos variáveis. Além disso, medidas de f0 analisadas na fala concatenada apresentaram, em geral, um melhor potencial discriminatório do que quando extraídas de vogais prolongadas. Os resultados reforçam a relevância da análise de descritores da f0 para fins forenses, especialmente da f0 baseline, medida com os menores valores de EER observados Abstract: The present thesis proposes a multiparametric analysis of phonetic-acoustic measures in comparisons performed with genetically related individuals, namely, identical twins, and across all subjects in the study (i.e., cross-pair comparisons). The central research question may be formulated as "which phonetic-acoustic parameters and analysis dimensions, namely the spectral, temporal, and fundamental frequency dimensions, are the most inter-speaker discriminatory in comparisons performed between genetically related individuals and across all speakers, and therefore potentially relevant for the forensic speaker comparison application?''. Parameters pertaining to three different phonetic-acoustic dimensions were analyzed: formant frequencies (spectral), speech timing (temporal), and fundamental frequency (melodic) estimates yielding a total of 30 phonetic-acoustic parameters. The participants were 20 subjects, ten identical male twin pairs, Brazilian Portuguese (BP) speakers from the same dialectal area, aged between 19 and 35. The speech material consisted of spontaneous telephone conversations between twins, with dialogue topics decided by the pairs. Concerning the main outcomes, evidence was found suggesting high-formant frequencies, namely F3 and F4, as potentially more speaker discriminatory than low-formant frequencies, as verified by the proportion of significant differences across speakers and the comparison of effect sizes. However, between these two formants, F3 has shown to possess the desired properties expressed by the combination of lower Cllr/EER, which is compatible with higher accuracy, and high AUC values, compatible with high discriminatory power. Regarding vowel quality, the low central vowel [a] and front vowels appeared as the most speaker-discriminatory segments. These segments also seemed to display higher Euclidean distances from their neighbors, inviting the hypothesis of a probable relationship between vowel acoustic dispersion and the level of phonetic variation allowed by the phonological system. Furthermore, even though stressed vowels appeared more speaker-discriminatory than unstressed vowels, the combination of both vowel classes seemed to be more explanatory in terms of the observed inter-speaker differences. As for speech timing parameters, evidence was found supporting the category of macro speech timing parameters, mainly speech rate and articulation rate, as the most discriminatory and consistent parameters for speaker comparison applications under unscripted speech conditions. Moreover, the analysis of speech timing estimates in identical twin pairs revealed a remarkable level of intra-pair similarities, substantially higher than the observed for the same speakers' formant frequency patterns. Some explanatory factors, including the overlapping effects of "prosodic entrainment'' and "shared speech timing patterns/representations'', were suggested to account for such a high convergence. As for f0 descriptors, f0 baseline, median, mean, and extreme values were found to display higher proportions of intra-twin pair and cross-pair differences while also presenting the largest effect sizes. Conversely, f0 variation and modulation estimates were found relatively more stable across different subjects. Moreover, f0 metrics assessed in connected speech tended to present a better discriminatory potential than lengthened vowels. The outcomes reinforce the relevance of analyzing long-term f0 metrics for forensic purposes, particularly f0 baseline, which displayed the lowest EER values among all tested f0 estimates Doutorado Lingüística Doutor em Linguística CNPQ 140364/2017-00 CAPES 88887.308270/2018-00