Diplom-, Master-, Bachelor- oder Studienarbeiten

Trotz des Weggangs von Prof. Fürnkranz werden Abschlussarbeiten am Fachgebiet Knowledge Engineering weiterhin angeboten!
Theses are still offered and supervised by the Knowledge Engineering Group despite Prof. Fürnkranz leaving.

Im Fachgebiet Knowledge Engineering (Prof. J. Fürnkranz) werden zur Zeit folgende Themen für studentische Arbeiten angeboten. Die meisten Themen eignen sich sowohl für Master-, als auch für Studien- oder Bachelor-Arbeiten, wobei bei letzteren natürlich eine etwas weniger tiefe Behandlung des Themas erwartet wird.

Als Vorkenntnisse werden absolvierte Vorlesungen bzw. praktische Erfahrung in maschinellem Lernen, Data Mining oder einem verwandten Gebiet erwartet.

Die Themen-Liste ist keineswegs vollständig und Sie sind auch herzlich eingeladen, selbst Themen vorzuschlagen. Am Fachgebiet findet auch regelmäßig ein Ober-Seminar statt, in dem laufende oder gerade fertig gestellte Arbeiten vorgestellt werden.

Antworten auf häufig gestellte Fragen zu Abschlußarbeiten finden Sie in unserer FAQ.

All theses can be written in English (in fact, this is strongly encouraged). English descriptions of individual topics are available upon request. Prior coursework or practical experience in machine learning, data mining or similar is expected.


(Multi-Label) Rule Learning

Stratified Sampling of Multi-Label Data

Bachelor- oder Masterarbeit

Ansprechpartner: MR

Um die Varianz innerhalb eines Ensembles von Entscheidungsbäumen oder Regeln zu erhöhen, werden einzelne Bäume oder Regeln häufig auf einem zufällig gewählten Subset der verfügbaren Trainingsbeispiele gelert. Die Verwendung von "Gradient-based One-side Sampling" (GOSS) in LightGBM hat außerdem gezeigt, dass die Auswahl der Beispiel einen maßgeblichen Einfluss auf die Vorhersagegenauigkeit des gelernten Modells hat. Bei diesem Verfahren werden die Beispile anhand dazugehöriger Gradienten, die als Teil des Gradient Boosting-basierten Trainingsprozesses berechnet werden, ausgewählt.

Am Fachbereich wurde ein Regellerner für Multi-label Klassifizierung entwickelt, der ebenfalls auf Gradient Boosting basiert. Der bestehende Algorithmus soll im Rahmen dieser Arbeit um Gradienten-basiertes Sampling erweitert werden. Anders als bei Binärer Klassifizierung erfordert dies, abhängig von der Loss-Funktion, unterschiedliche Verfahren zur Stratifizierung der Multi-Label-Daten zu verwenden. Die Effektivität der erarbeiteten Verfahren soll außerdem experimentell untersucht werden.

Referenzen: LightGBM, Stratification of Multi-Label Data


Stochastic Gradient Rules

Bachelor- oder Masterarbeit

Ansprechpartner: MR

Lernverfahren, die auf Gradient Boosting basieren, werden üblicherweise verwendet, um Ensembles von Entscheidungsbäumen oder Regeln zu lernen. Der Trainingsprozess besteht dabei aus mehreren Scrhitten in denen jeweils ein neuer Baum oder eine neue Regel zum Modell hinzugefügt wird. In jedem dieser Schritte soll das Modell möglichst so erweitert werden, dass dessen insgesamte Vorhersagegenauigkeit erhöht wird.

Basierend auf dieser Grundidee wurden kürzlich sogenannte "Stochastic Gradient Trees" vorgeschlagen. Ziel dieses Verfahrens ist es, statt einem Ensemble von Entscheidungsbäumen, einen einzelnen Baum zu lernen. Statt neue Bäume hinzuzufügen, wird dieser Baum schrittweise modifiziert, so dass dessen Vorhersagen verbessert werden.

In dieser Arbeit soll die Funktionsweise von "Stochastic Gradient Trees" auf das Lernen von kompakten Regelmengen übertragen werden. Für die Umsetzung kann dabei auf eine bereits existierende Implementierung von Gradient Boosting zum Lernen von Regeln zurückgegriffen werden.

Referenzen: Stochastic Gradient Trees

 

Game Playing

General Video Game Playing

Ansprechpartner: TJ

Unter General Video Game Playing versteht man das Spielen mehrerer unterschiedlicher Videospiele durch den gleichen Agenten. Anders als bei Schach, Go oder Poker kann hier nicht auf spielspezifisches Wissen zurückgegriffen werden, sondern muss ein möglichst allgemeiner Agent entwickelt werden, der in der Lage ist unterschiedlichste Spiele zu spielen.

Die General Video Game AI Competition (GVGAI) ist ein von Google Deepmind unterstützter internationaler Wettbewerb, in welchem Agenten auf unterschiedlichen Spielen, die sie vorher nicht kannten, gegeneinander antreten. Die Spiele sind in einem einheitlichen Framework, der Video Game Description Language (VGDL) implementiert.

Aktuell sind keine GVGAI-Arbeiten offen. Themenvorschläge aber möglich!

 

Data Mining

Competitions im Data Mining

Im Bereich des Data Mining gibt es eine Vielzahl an Wettbewerben, Competitions und Challenges. Ein jährlicher Wettbewerb, an dem die Knowledge Engineering Group regelmäßig teilnimmt, ist der  Data Mining Cup. Dabei werden besonders Vorhersageprobleme aus dem Feld der Recommender Systeme gestellt. Ein weiterer Wettbewerb, diesmal aus dem Bereich der Künstlichen Intelligenz, ist die Computer Poker Competition. Die Teilnahmen fanden jeweils im Rahmen eines Praktikums statt.

Wir möchten Studierenden die Möglichkeit geben, auch an weiteren interessanten Wettbewerben im Bereich des Data Mining und der Künstlichen Intelligenz teilnehmen zu können. Dies wird im Normalfall im Rahmen einer Studienarbeit stattfinden, aber je nach Aufwand und Vor- und Nacharbeit ist auch eine Bachelor- oder Masterarbeit oder ein Projektpraktikum denkbar.

Im Folgenden stellen wir eine kleine Liste laufender bzw. abgeschlossener (soweit aktualisiert) Wettbewerbe statt:

Weitere Möglichkeiten, um sich über aktuelle Wettbewerbe zu informieren, bieten:

    Kontakt

    small ke-icon

    Knowledge Engineering Group

    Fachbereich Informatik
    TU Darmstadt

    S2|02 D203
    Hochschulstrasse 10

    D-64289 Darmstadt

    Sekretariat:
    Telefon-Symbol+49 6151 16-21811
    Fax-Symbol +49 6151 16-21812
    E-Mail-Symbol info@ke.tu-darmstadt.de

     
    A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
    zum Seitenanfangzum Seitenanfang