Back to Search
Start Over
MODELOVANJE TEMA U TEKSTU NA OSNOVU NASLOVA DOKUMENATA
- Source :
- Zbornik radova Fakulteta tehničkih nauka u Novom Sadu. 38:362-365
- Publication Year :
- 2023
- Publisher :
- Faculty of Technical Sciences, 2023.
-
Abstract
- U radu je predstavljen pristup za modelovanje tema i klasifikaciju tekstualnih dokumenata. Konkretno, vršena je 1) primena LDA (Latent Dirichlet Allocation) nad tekstom zarad dobijanja tema, pri čemu je evaluacija rađena kvalitativno, kroz semantiku pronađenih tema; 2) klasifikacija dokumenta primenom reprezentacije teksta dobijene kombinacijom tf-idf obeležja i tema izvučenih pomoću LSA (Latent Semantic Analysis); nad ovom reprezentacijom treniran je Naive Bayes klasifikator, a evaluacija je vršena računanjem F-mere, 3) klasifikacija dokumenta primenom tf-idf reprezentacije teksta, gde je eksperimentisano sa treniranjem SVM (Support Vector Machines) i RF (Random Fores) modela; I u ovom slučaju evaluacija je vršena računanjem F-mere.
- Subjects :
- Industrial and Manufacturing Engineering
Subjects
Details
- ISSN :
- 25605925 and 0350428X
- Volume :
- 38
- Database :
- OpenAIRE
- Journal :
- Zbornik radova Fakulteta tehničkih nauka u Novom Sadu
- Accession number :
- edsair.doi...........e045b8e520277feddf8cb2ebc51447c6
- Full Text :
- https://doi.org/10.24867/22be11lepar