4 results on '"Divergencia de Kullback-Leibler"'
Search Results
2. Estratégias Lexicométricas para Detetar Especificidades Textuais
- Author
-
Iriarte Sanromán, Álvaro, Gamallo Otero, Pablo, and Simões, Alberto
- Subjects
Computational Linguistics ,divergência de Kullback-Leibler ,lexicometria ,lexical divergence ,lexicometry ,Kullback–Leibler divergence ,divergência lexical ,divergencia de Kullback-Leibler ,Natural Language Processing - Abstract
Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela)., Este trabalho ́e apoiado pelo projeto Narrativas, usos e consumos de visitantes como aliados ou amena ̧cas para o bem-estar da comunidade lo- cal: o caso de Santiago de Compostela. Ref: FFI2017-88196-R, parcialmente subsidiado pelo Ministerio de Industria, Econom ́ıa y Competiti- vidad espanhol no quadro do Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (2018-2021).
- Published
- 2018
3. Estratégias lexicométricas para detetar especificidades textuais
- Author
-
Alberto Simões, Pablo Gamallo Otero, Álvaro Iriarte Sanromán, Universidade do Minho, Universidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Información, and Universidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeral
- Subjects
lcsh:Language and Literature ,Linguistics and Language ,Kullback-Leibler divergence ,Social Sciences ,02 engineering and technology ,Kullback–Leibler divergence ,Language and Linguistics ,lcsh:P1-1091 ,0202 electrical engineering, electronic engineering, information engineering ,lexical divergence ,Humanidades::Outras Humanidades ,lexicometry ,Lexicometria ,Divergência de Kullback-Leibler ,Outras Humanidades [Humanidades] ,Natural Language Processing ,Physics ,4. Education ,020206 networking & telecommunications ,Divergência lexical ,Computational Linguistics ,lcsh:Philology. Linguistics ,Divergencia de Kullback-Leibler ,lcsh:P ,020201 artificial intelligence & image processing ,Humanities ,divergencia de Kullback-Leibler - Abstract
Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela)., Este trabalho é apoiado pelo projeto Narrativas, usos e consumos de visitantes como aliados ou amena¸cas para o bem-estar da comunidade local: o caso de Santiago de Compostela. Ref: FFI2017-88196-R, parcialmente subsidiado pelo Ministerio de Industria, Econom´ıa y Competitividad espanhol no quadro do Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (2018-2021).
- Published
- 2018
4. Recuperació d'Informació i Avaluació del Risc de privacitat a Twitter
- Author
-
Kapi, Christina, Universitat Politècnica de Catalunya. Departament d'Enginyeria Telemàtica, Forné Muñoz, Jorge, and Lambrinoudakis, Constantinios
- Subjects
Internet--Security measures ,Kullback–Leibler divergence ,Recuperació de la informació ,Entropía de Shannon ,User Profiling ,Seguretat informàtica ,Internet -- Mesures de seguretat ,Measurement of User Privacy ,Divergencia de Kullback-Leibler ,Informàtica::Seguretat informàtica [Àrees temàtiques de la UPC] ,Tecnologías de protección de la privacidad ,Perfiles de usuario ,Computer security ,Shannon’s Entropy ,Redes Sociales ,Information retrieval ,Privacy-Enhancing Technologies ,Métricas de la privacidad del usuario ,Social Networking Services - Abstract
Projecte realitzat en el marc d’un programa de mobilitat amb la University of Piraeus In recent times, a growing number of information retrieval applications are disposable, aiming to trace users’ online behavior and activities. One of the most popular social networks, which can be considered as a valuable source of information to this kind of applications, is Twitter. Aggregated data that derive from Twitter can show great power in delivering information related to users’ interests and preferences. The process of correlating information can result in the construction of comprehensive user profiles that may disclose detailed personal information and raise challenges to users’ privacy as well. Extracted behavioral patterns of users can be substantial to the development of personalization services, however, inevitably at the expense of users’ privacy. Although there are a number of privacy-enhancing technologies, which strive to mitigate many of these concerns, significant gaps remain regarding the privacy protection of users. In addition, it is essential to provide a comprehensive view on metrics which consist in quantifying privacy. Most of the efforts devoted to devise privacy metrics are quite limited, as they apply to concrete systems. The lack of suitable metrics is deterrent to the proper privacy evaluation. Therefore, even though proposed approaches have made meaningful contributions to the challenging privacy landscape, there still exists a certain ambiguity about their effectiveness and adjustment to different contexts. In this work, we present an effort towards the construction of user profiles, through the development process of an information retrieval application. We also tackle the privacy issues related to user profiling, as personal information contained in user profiles is disclosed. The last part of this thesis approaches the theme of quantifying user privacy by applying information-theoretic notions as measures of the privacy of user profiles.
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.