Система сентимент аналізу тексту та побудова словника тональності в задачах комп’ютерної лінгвістики

Тимощук, Оксана Леонідівна
Київ, 2018.


Магістерська дисертація: 100 с., 4 рис., 21 табл., 2 додатки, 15 джерел. Тема дисертації: «Система сентимент аналізу тексту та побудова словника тональності в задачах комп’ютерної лінгвістики». Об’єкт дослідження: обробка природньої мови в задачах розпізнавання тональності тексту. Мета роботи – розроблення програмного продукту, який надає можливість виконувати аналіз тональності тексту чи завантаженого файлу на українській мові на базі побудованого словника. Метод дослідження – методи аналізу тональності тексту, словниковий метод. Метод ітеративного поповнення словника. Програмна реалізація виконана на мові програмування Java із використанням платформи JavaFX. Предметом дослідження є моделі і алгоритми сентимент аналізу. Отримані результати: досліджено і обрано метод для побудови системи. Обрано алгоритм поповнення (розширення) початкового словника. Розроблено програмний продукт, в якому реалізовано зазначені алгоритми. Дана система дозволяє виконувати автоматичне розмічення (визначення емоційного забарвлення) відгуків у файлі або тексту, введеного безпосередньо у програму. Реалізована варіативність і візуальність у представленні отриманих результатів. Master's thesis: 100 pp., 4 fig, 21 tables, 2 appendix, 15 sources. Theme of the dissertation: "System of sentimental analysis of the text and construction of vocabulary of tonality in the tasks of computer linguistics". Object of research: sample with reviews, each record of the sample contains the data on the category of the review, the text of the review itself and its evaluation is determined expert way. The purpose of the work is to develop a software product that provides the ability to analyze the tonality of the text or the downloaded file in the Ukrainian language based on the built-in dictionary. Method of research - methods of analysis of the tonality of the text, the vocabulary method. The method of iterative replenishment of the dictionary. The software implementation is performed in the Java programming language using the JavaFX platform. The subject of the study is the models and algorithms of the analysis sentiment. Obtained results: the method for constructing the system was studied and selected. The algorithm of replenishment (expansion) of the initial dictionary is chosen. A software product has been developed, in which the specified algorithms are implemented. This system allows automatic placement (determination of emotional coloring) of responses in a file or text entered directly into the program. Realization of variability and visibility in the presentation of the results.


