1. Una strategia di Text Mining basata su regole di associazione
- Author
-
BALBI, SIMONA, DI MEGLIO E., E. AURELI CUTILLO, S. BOLASCO, Balbi, Simona, and DI MEGLIO, E.
- Subjects
"bag-of-words" ,segmentazione ,categorizzazione del testo - Abstract
Questo lavoro propone una strategia per affrontare l'analisi di corpora di grandi dimensioni che presentino una strutturazione interna, con il duplice vantaggio, da un lato, di un notevole risparmio del peso computazionale dell'analisi e, dall'altro, di introdurre elementi relativi al contesto in cui le singole parole sono utilizzate. La strategia si avvale di un modesto intervento preliminare da parte di esperti al fine di pervenire, grazie all'utilizzo di metodi statistici di segmentazione, alla categorizzazione del testo e alla costruzione, sulla base di un training set, di regole di associazione, Queste regole, applicate all'intero corpus, consentono si sottoporre ad analisi soltanto i frammenti individuati come di interesse diretto per gli obiettivi conoscitivi perseguiti
- Published
- 2004