Data Mining Cup 2013

Praktikum aus maschinellem Lernen und Data Mining (6 CP)

News

Die finale Deadline für die Einreichung der Programme ist der 15.5.

Anmeldung

Es ist eine verbindliche Anmeldung per Mail bis zum 10.03.2013 nötig, da auf Grund der Wettbewerbsmodalitäten ein Beginn während der vorlesungsfreien Zeit erforderlich ist. Dies ist natürlich kein Ersatz für eine TUCaN Anmeldung.

Vorbesprechung

Die Vorbe­sprechung findet am Dienstag, den 12.03.2013 um 15:20 Uhr statt.​ Der Raum wird noch bekannt gegeben. Bitte beachten Sie, dass eine Teilnahme zwingend notwendig ist

In­halt und Ablauf

Im Zuge dieses Prak­tikums wer­den wir am Data Min­ing Cup teilnehmen.​ Der Data Min­ing Cup ist ein internationaler Wet­tbe­werb für Studenten.​ Dabei muß eine fest­gelegte Data Min­ing Auf­gabe gelöst werden.​ In den letzten Jahren wurden vorzugsweise reelle Daten aus dem Verkauf analysiert, so sollten u.a. Buchverkäufe, Gutscheineinlösungen, Auktionspreise und Zahlungsausfälle vorhergesagt werden. Die diesjährige Auf­gabe wird am 3.​ April 2013 veröffentlicht.​ Die bis 15.​05.2013​ eingesandten Lösun­gen wer­den gesam­melt und von den Ve­r­anstal­tern an­hand einer Test-Menge, deren Ausgänge vorher un­bekan­nt sind, evaluiert.

Auf­gabe des Prak­tikums ist Ausar­beitung und Ein­re­ichung einer Lösung für den Data Min­ing Cup.​ Die Haup­tar­beit wird dabei in den er­sten Wochen des Som­mersemesters an­fall­en, in denen Sie in Teams von bis zu drei Personen die Lösung er­ar­beit­en müssen.​ Die einzel­nen Lösun­gen sollen dann im Zuge des weit­eren Ver­laufs des Prak­tikums (noch vor Bekan­nt­gabe der of­fiziellen Lösung) doku­men­tiert und im Rah­men von Vorträgen vorgestellt wer­den.

Das Prak­tikum be­gin­nt schon Anfang März.​ Die Idee ist, daß Sie bis zum Beginn des Wettbewerbs Auf­gaben aus den let­zten Jahren bear­beit­en um sich grundlegende Techniken anzueignen und Ihre Lösung dann beim er­sten Tr­e­f­fen im SS vorstellen.​ Während der er­sten Phase der Ausar­beitung der Lösung wer­den in etwa alle zwei Wochen Tr­e­f­fen zum Ideenaus­tausch stat­tfind­en, in der heis­sen Phase des Prak­tikums (während der Laufzeit des Wet­tbe­werbs) wer­den wir uns vo­raus­sichtlich öfters tr­e­f­fen. Am Ende werden die zwei besten Lösungen ermittelt und eingereicht.

Termine

So, 10.03.2013 Anmeldefrist
Di, 12.03.2013 Vorbesprechung, Gruppeneinteilung, Verteilung der Themen (um 15:20 Uhr in Raum S202/E202)
Mo, 25.03.2013 Zwischenbesprechung (um 15:00 Uhr in Raum S202/A126)
Do, 04.04.2013 Besprechung der aktuellen Aufgabenstellung, Abgabe der Präsentationen (um 15:00 Uhr in Raum S202/E302)
Do, 11.04.2013 1. Besprechung (um 15:00 Uhr in Raum S202/D219)
Di, 16.04.2013 Abschlußberichte der Themen der letzten Jahre (regulärer Termin)
Di, 23.04.2013 reguläre Besprechung (15:20 Uhr in Raum S202/D219)
Di, 30.04.2013 reguläre Besprechung (15:20 Uhr in Raum S202/D219)
Di, 07.05.2013 reguläre Besprechung (15:20 Uhr in Raum S202/D219)
Di, 14.05.2013 reguläre Besprechung (15:20 Uhr in Raum S202/D219)
Mi, 15.05.2013 Letzte Möglichkeit zur Einreichung der Programme beim DMC

Beurteilung

Die Lösun­gen können in Grup­pe­nar­beit (2-3 Teil­nehmer pro Gruppe) er­stellt werden.​ Beurteilt wird Ihr En­gage­ment für das Prak­tikum und die Qualität Ihres Lösungsweges (nicht unbe­d­ingt die Qualität der Lösung selb­st, d.​h.​ das Ab­schnei­den im Wet­tbe­werb ist nicht un­mit­tel­bar noten­rel­e­vant).

Wiki und Forum

Zu der Veranstaltung wird es einen Wiki und ein Forum geben. Das Wiki ist dazu gedacht Neuigkeiten zu veröffentlichen, sowie Termine bekannt zu geben. Außerdem wird es dort auch allgemeine Informationen geben. Im Forum sollten Fragen zu entsprechenden Problemen, die während des Prozesses auftreten, gestellt und vor allem auch beantwortet werden. Die Links werden noch bekannt gegeben

Lit­er­atur

Die fol­gen­den Ar­tikel könnten für eine er­fol­gre­iche Pro­jekt-Bewälti­gung hil­fre­ich sein:

Tools

Die folgenden Software-Tools stellen Algorithmen und Werkzeuge für das Bearbeiten der Arbeit bereit:
  • Weka: Eins der beliebtesten Frameworks und APIs im Maschinellem Lernen, in Java geschrieben.
  • RapidMiner: Framework ähnlich Weka aus Deutschland mit besserer GUI und weiteren Funktionen, Java.
  • NTLK: Spezialisiert auf Natural Language Processing, stellt aber auch Algorithmen nach Stand der Technik für Python zur Verfügung
  • SVMlight: Gute Implementierung von Support-Vektor-Maschinen, alternatives LibSVM Framework ist auch z.B. in Weka verfügbar.

Links

Kontakt

A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang