Back to Search
Start Over
Estratégias lexicométricas para detetar especificidades textuais
- Source :
- Repositório Científico de Acesso Aberto de Portugal, Repositório Científico de Acesso Aberto de Portugal (RCAAP), instacron:RCAAP, Minerva. Repositorio Institucional de la Universidad de Santiago de Compostela, instname, Linguamática, Vol 10, Iss 1 (2018)
- Publication Year :
- 2018
- Publisher :
- Universidade do Minho, 2018.
-
Abstract
- Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).<br />Este trabalho é apoiado pelo projeto Narrativas, usos e consumos de visitantes como aliados ou amena¸cas para o bem-estar da comunidade local: o caso de Santiago de Compostela. Ref: FFI2017-88196-R, parcialmente subsidiado pelo Ministerio de Industria, Econom´ıa y Competitividad espanhol no quadro do Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (2018-2021).
- Subjects :
- lcsh:Language and Literature
Linguistics and Language
Kullback-Leibler divergence
Social Sciences
02 engineering and technology
Kullback–Leibler divergence
Language and Linguistics
lcsh:P1-1091
0202 electrical engineering, electronic engineering, information engineering
lexical divergence
Humanidades::Outras Humanidades
lexicometry
Lexicometria
Divergência de Kullback-Leibler
Outras Humanidades [Humanidades]
Natural Language Processing
Physics
4. Education
020206 networking & telecommunications
Divergência lexical
Computational Linguistics
lcsh:Philology. Linguistics
Divergencia de Kullback-Leibler
lcsh:P
020201 artificial intelligence & image processing
Humanities
divergencia de Kullback-Leibler
Subjects
Details
- Language :
- Portuguese
- Database :
- OpenAIRE
- Journal :
- Repositório Científico de Acesso Aberto de Portugal, Repositório Científico de Acesso Aberto de Portugal (RCAAP), instacron:RCAAP, Minerva. Repositorio Institucional de la Universidad de Santiago de Compostela, instname, Linguamática, Vol 10, Iss 1 (2018)
- Accession number :
- edsair.doi.dedup.....5bea186f92f76f01dcd2a532da1062e9