Back to Search Start Over

Estratégias lexicométricas para detetar especificidades textuais

Authors :
Alberto Simões
Pablo Gamallo Otero
Álvaro Iriarte Sanromán
Universidade do Minho
Universidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Información
Universidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeral
Source :
Repositório Científico de Acesso Aberto de Portugal, Repositório Científico de Acesso Aberto de Portugal (RCAAP), instacron:RCAAP, Minerva. Repositorio Institucional de la Universidad de Santiago de Compostela, instname, Linguamática, Vol 10, Iss 1 (2018)
Publication Year :
2018
Publisher :
Universidade do Minho, 2018.

Abstract

Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).<br />Este trabalho é apoiado pelo projeto Narrativas, usos e consumos de visitantes como aliados ou amena¸cas para o bem-estar da comunidade local: o caso de Santiago de Compostela. Ref: FFI2017-88196-R, parcialmente subsidiado pelo Ministerio de Industria, Econom´ıa y Competitividad espanhol no quadro do Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (2018-2021).

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Repositório Científico de Acesso Aberto de Portugal, Repositório Científico de Acesso Aberto de Portugal (RCAAP), instacron:RCAAP, Minerva. Repositorio Institucional de la Universidad de Santiago de Compostela, instname, Linguamática, Vol 10, Iss 1 (2018)
Accession number :
edsair.doi.dedup.....5bea186f92f76f01dcd2a532da1062e9