Back to Search Start Over

MODELOVANJE TEMA U TEKSTU NA OSNOVU NASLOVA DOKUMENATA

Authors :
Minja Lepar
Source :
Zbornik radova Fakulteta tehničkih nauka u Novom Sadu. 38:362-365
Publication Year :
2023
Publisher :
Faculty of Technical Sciences, 2023.

Abstract

U radu je predstavljen pristup za modelovanje tema i klasifikaciju tekstualnih dokumenata. Konkretno, vršena je 1) primena LDA (Latent Dirichlet Allocation) nad tekstom zarad dobijanja tema, pri čemu je evaluacija rađena kvalitativno, kroz semantiku pronađenih tema; 2) klasifikacija dokumenta primenom reprezentacije teksta dobijene kombinacijom tf-idf obeležja i tema izvučenih pomoću LSA (Latent Semantic Analysis); nad ovom reprezentacijom treniran je Naive Bayes klasifikator, a evaluacija je vršena računanjem F-mere, 3) klasifikacija dokumenta primenom tf-idf reprezentacije teksta, gde je eksperimentisano sa treniranjem SVM (Support Vector Machines) i RF (Random Fores) modela; I u ovom slučaju evaluacija je vršena računanjem F-mere.

Details

ISSN :
25605925 and 0350428X
Volume :
38
Database :
OpenAIRE
Journal :
Zbornik radova Fakulteta tehničkih nauka u Novom Sadu
Accession number :
edsair.doi...........e045b8e520277feddf8cb2ebc51447c6
Full Text :
https://doi.org/10.24867/22be11lepar