Data Mining
Vorlesung Sommersemester 2017
Pflichtmodul im Studiengang Master Informatik
- Vorlesung: Montag, 10:00 - 11:30
- Übung: Montag, 12:30 - 14:00
Ziel ist der Veranstaltung ist, die Studierenden zu befähigen, mit algorithmischen Methoden Informationen aus großen Datenmengen zu gewinnen und diese Informationen zur Einordnung neuer Daten in gegebene Kategorien zu nutzen.
Inhalt
- Probleme des Data Mining: Merkmale, Klassenstruktur, Data MiningProcess
- Datenaufbereitung: Merkmalsbewertung, Merkmalsauswahl
- Maschinenlernen: Lazy Learner, Support Vector Machines, Entscheidungsbäume
- Validierung der Ergebnisse: Kreuzvalidierung, Kombination mehrerer Lerner
- Beispiele: Web-Mining, Text-Mining, Recommender Systems
Software
Programmierung in R
Literatur
- T. Hastie/ R. Tishirani/ J. Friedman: Elements of Statistical Learning, Springer 2012
- E. Alpaydin: Introduction to Machine Learning, MIT Press 2004
- I. Witten/ E.Frank/ M. Hall: Data Mining, 3rd edition, Morgan Kaufmann 2011
- Ch. Bishop: Pattern Recognition and Machine Learning, Springer 2006
- R.O.Duda, P.E.Hart, D.G. Stork: Pattern Classification, 2nd edition 2001, Wiley and Sons