Back to Search Start Over

Decomposizione CUR per una migliore analisi dei dati

Authors :
Sebastiani, Andrea
thesis supervisor: Simoncini, Valeria
Sebastiani, Andrea
thesis supervisor: Simoncini, Valeria

Abstract

Le tecniche comunemente utilizzate nell'analisi dei dati permettono di esprimere grandi matrici di dati in termini di un insieme di alcuni vettori ortogonali detti componenti principali. Solitamente questi vettori, essendo combinazioni lineari delle colonne e delle righe della matrice, risultano difficili da interpretare in termini del processo da cui provengono i dati. In questa tesi viene presentata e studiata la decomposizione CUR che permette di rappresentare la matrice in termini di alcune righe e/o colonne della matrice stessa. Tale proprietà rende più facile l'interpretazione dei risultati in termini dei dati di partenza. In particolare vengono presentati due algoritmi randomizzati per il campionamento delle righe/colonne della matrice e per la costruzione delle matrici della decomposizione. La tecnica utilizzata per il campionamento è una particolare strategia chiamata "subspace sampling" che permette di dimostrare l'esistenza di garanzie di tipo probabilistico per l'errore della decomposizione. Infine vengono presentati i risultati della riduzione delle informazioni di un dataset, proveniente da una directory web, ottenuta mediante la decomposizione CUR.

Details

Database :
OAIster
Notes :
Free to read, Italian
Publication Type :
Electronic Resource
Accession number :
edsoai.on1362636522
Document Type :
Electronic Resource