Maschinelles Lernen: Symbolische Ansätze - WS 06/07

Prof. Dr. J. Fürnkranz, Dr. G. Grieser

Die Veranstaltung im Vorlesungsverzeichnis.


Tag Zeit Raum Start
Vorlesung Donnerstag 09:50-11:30 S202/C110 19.10.
Übung Dienstag 09:50-11:30 S202/C110 24.10.

Ankündigungen

Die Ergebnisse der Klausur im WS 07/08 hängen ab sofort am Brett neben Raum E 304 aus und sind außerdem über das WebReg-System einsehbar. Die Klausureinsicht findet am Freitag, den 7.3.08 von 10:00-11:00 Uhr in Raum E302 statt.

Klausur

Alte Klausuren:

Inhalt

Durch die Entwicklung der Informationstechnologie sind immer größere Datenmengen verfügbar. Diese enthalten oft implizites Wissen, das, wenn es bekannt wäre, große wirtschaftliche oder wissenschaftliche Bedeutung hätte. Data Mining ist ein Forschungsgebiet, das sich mit der Suche nach potentiell nützlichem Wissen in großen Datenmengen beschäftigt, und Maschinelles Lernverfahren gehören zu den Schlüsseltechnologien innerhalb dieses Gebiets.

Die Vorlesung bietet eine Einführung in das Gebiet des Maschinellen Lernens unter dem besonderen Aspekt des Data Minings. Es werden Verfahren aus verschiedenen Paradigmen des Maschinellen Lernens mit exemplarischen Anwendungen vorgestellt. Um das Wissen zu operationalisieren, werden in den Übungen praktische Erfahrungen mit Lernalgorithmen gesammelt.

Übungen

In den Übungen erhalten Sie Aufgaben über den Vorlesungsstoff, oft alte Klausur-Aufgaben, die Sie selbst lösen sollen, und die dann in der folgenden Übungsstunde durchbesprochen werden.

Projekt

Zusätzlich erhalten Sie in der Mitte des Semesters eine praktische Aufgabe, die Sie mit Hilfe der Data Mining Software Weka bearbeiten sollen.

Ein erfolgreiche Bearbeitung der Aufgaben führt zu einer Notenverbesserung um eine Notenabstufung (0.3), allerdings nur bei bestandener Klausur.

Informationen zum Projekt finden Sie hier. Die Folien zum Projekt stehen nun hier zum Download zur Verfügung.

Hinweis: In der Aufgabe 3 und den folgenden sollen die Klassifizierer mit einer einfachen 10-fold Cross-Validation (1x10 CV) bewertet werden (siehe Forum).

Der Wettbewerb ist abgeschlossen. Es haben sich 36 Studenten in 22 Gruppen beteiligt und enorm viel Aufwand und Zeit investiert. Ganz vielen Dank an alle.
Wir haben die gelernten Modelle auf einem separaten Testset evaluiert und so die reale Genauigkeit abgeschätzt. Die Gewinner sind:
1. Platz (97,9% Genauigkeit): Stefan Appel, Sandra Ebert, Nina Sandholm, Aleksander Velikov und Yanje Wu
2. Platz (97,7% Genauigkeit): Claus Brech, Simon Kulessa, Patrick Sona und Marc Weber
3. Platz (97,2% Genauigkeit): Paul Arndt
Ganz herzlichen Glückwunsch!

 

Forum

Das Diskussionsforum zur Lehrveranstaltung finden Sie hier.

Literatur

Die folgenden beiden Lehrbücher behandeln einen Großteil des Stoffes: Während die Lehrbücher den Stoff im Großen und Ganzen behandeln, und in vielen Punkten auch noch tiefer gehen, werden in der Vorlesung zum Teil andere Schwerpunkte gesetzt. Als ergänzende Literatur empfehlen wir im Wesentlichen die folgenden Arbeiten (bitte auf Updates achten):

Papers zu vielen Themen finden Sie oft auch mit CiteSeer, DER Suchmaschine für wissenschaftliche Texte der Informatik

Data Mining Tutor

Machine-Learning-Werkzeuge

Beispiel-Datensätze

Demos

Data Mining-Wettbewerbe

Wenn Sie Interesse haben, am Data Mining Cup 2007 teilzunehmen, besuchen Sie das Praktikum aus Maschinellem Lernen im Sommersemester 2007! (voraussichtlicher Beginn bereits unmittelbar nach Ende der Vorlesung!!)
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang