Insegnamento mutuato da: B024275 - DATA AND DOCUMENT MINING Laurea Magistrale in INGEGNERIA INFORMATICA
Lingua Insegnamento
Italiano
Contenuto del corso
Organizzazione record e file
Alberi B, hash in memoria secondaria
Indici invertiti
Basi di dati di documenti e DL
Esercitazioni
Document Engineering
Datawarehouse e DataMining
(B) H.Garcia-Molina, J.D. Ullman, J. Widom. Database systems the
complete book. Prentice-Hall International - 2002
(I) C.D. Manning, P. Raghavan, P. Raghavan Introduction to Information
Retrieval, Cambridge University Press - 2008
(B) I. Witten, A. Moffat, T.C. Bell Managing Gigabytes, Van Nostrand
Reinhold – 1999
(I) W. Y. Arms Digital Libraries, MIT press - 2000
(B) M Lesk, Understanding Digital Libraries Mk
(I) A. Rajaraman, J. D. Ullman, Mining of Massive Datasets, 2011
Nota:
(B) indica che il libro è presente nella biblioteca di S. Marta
(I) indica un libro scaricabile da Internet
Obiettivi Formativi
L’obiettivo del corso è di fornire conoscenze sul funzionamento delle tecniche di Data Mining e Document Mining.
Al termine del corso sarà possibile analizzare criticamente e
sviluppare algoritmi e metodi per la gestione efficiente di
grandi quantità di informazioni.
Prerequisiti
Nozioni apprese nei corsi di primo livello di Basi di Dati e Algoritmi e Strutture Dati.
Metodi Didattici
Lezioni frontali, esercitazioni in classe, svolgimento assistito
di elaborati.
Altre Informazioni
Gli esami orali vengono svolti nell'ufficio del docente, dopo aver concluso
l'elaborato.
Modalità di verifica apprendimento
Studio e presentazione di articolo (lavoro individuale) 15 %
Elaborato (gruppi di 2 persone) 65 %
Orale (individuale) su argomenti selezionati 20 %
Programma del corso
Introduction
Secondary Storage
Hardware, Record and file organization, Indexes,B trees, Dynamic hashing
Large scale file systems
Map-reduce, algorithms using Map-reduce
Information Retrieval
Document Engineering & DIAR
Data Mining
Finding Similar Items, Frequent itemsets, Clustering, High-dimensional spaces and dimensionality reduction, Web mining, Datawarehouse
Homework & project