Insegnamenti

 

60/15 - DATA MINING

Anno Accademico ​2014/2015

Docente
BARBARA ​PES (Tit.)
Periodo
Secondo Semestre​
Modalità d'Erogazione
Convenzionale​
Lingua Insegnamento




Informazioni aggiuntive

CorsoPercorsoCFUDurata(h)
[60/65] ​ ​MATEMATICA [65/00 - Ord. 2012] ​ ​PERCORSO COMUNE648
[60/73] ​ ​INFORMATICA [73/00 - Ord. 2012] ​ ​PERCORSO COMUNE648
Obiettivi

Fornire i fondamenti della moderna metodologia di analisi dati nota come Data Mining. In particolare, saranno illustrate le principali fasi dei processi di data mining, dalla preparazione dei dati, all’estrazione di patterns attraverso tecniche supervisionate (classificazione) e non supervisionate (clustering, regole di associazione), alla valutazione dei risultati.

Prerequisiti

Nozioni di base di algoritmi e strutture dati e di basi di dati.

Contenuti

1) INTRODUZIONE
- Che cos’e’ il Data Mining
- Il ruolo del Data Mining nei processi di KDD (Knowledge Discovery in Databases).

2) I DATI
- Proprietà dei datasets
- Qualità dei dati
- Pre-processing
- Misure di similarità e dissimilarità.

3) CLASSIFICAZIONE
- Generalità sui problemi di classificazione
- Tecniche di classificazione: Alberi decisionali, Classificatori a regole, Nearest-Neighbor, Classificatori Bayesiani, Reti Neurali, Support Vector Machines
- Il problema dell’overfitting
- Valutazione dei modelli di classificazione: metodi e metriche per la valutazione, confronto fra modelli.

4) REGOLE DI ASSOCIAZIONE
- Formulazione del problema (modello market-basket)
- Supporto e confidenza delle regole
- Algoritmo Apriori: ricerca degli itemsets frequenti, generazione delle regole
- Valutazione delle regole.

5) CLUSTERING
- Tipi di clustering
- Algoritmo K-means e varianti (Bisecting K-means)
- Tecniche gerarchiche
- Valutazione dei clusters.

6) L’AMBIENTE WEKA
- Come applicare le tecniche studiate durante il corso
- Esercitazioni.

Metodi Didattici

Lezioni frontali ed esercitazioni guidate (48 ore in totale), esercitazioni aggiuntive da svolgere a casa.

Verifica dell'apprendimento

Prova scritta che prevede domande a risposta aperta sul programma svolto (50% del voto finale) ed esercizi (restante 50%). Eventuale orale e/o progetto integrativo.

Testi

Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to Data Mining, Pearson.
Ian H.Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Third Edition, Elsevier.

Altre Informazioni

Strumenti a supporto della didattica: slides delle lezioni ed esercizi svolti.

credits unica.it | accessibilità Università degli Studi di Cagliari
C.F.: 80019600925 - P.I.: 00443370929
note legali | privacy

Nascondi la toolbar