Laufende Diplom-, Master- und Bachelorarbeiten

Im folgenden finden Sie einen Überblick über laufende Diplom-, Master- und Bachelorarbeiten im Fachgebiet Knowledge Engineering (Prof. J. Fürnkranz). Es gibt auch eine Liste aktueller Themen, bereits abgeschlossene Arbeiten finden Sie hier.

Laufende Arbeiten

Autor Titel Art Betreuer
Patrik Bitz TBA BA CW
Salem Borhan Optimierung eines Multilabel-Regellerners BA FJ, ELM
Jan Simon Bunten

Pseudo-Nash-optimaler Computerspieler für 3-Spieler-Limit-Poker

BA ELM
Raphael Burbach Predicting Failures based On Sequences of Diagnostic Messages BA SK
Michael Gleser

Keyword assignment at ULB

SA ELM,JF
Daniel Haftstein Reinforcement Learning for rollout policies in Hearthstone
MA CW
Zahra Hosseini Finding failure states in train log files with HMM MA SK
Tobias Joppen Preference-based MCTS MA CW
Dennis Kasch Interpretierbare Outlier Detection BA JF
Miriam Moneke D-Hat Search BA CW
Sandesh Nair Detecting Component Anomalies on Trains with One-class SVM MA SK
Michael Rapp A Separate-and-Conquer Algorithm for Learning Multi-Label Head Rules MA FJ, ELM
Dennis Schmidt Improving the Prediction of Power Converter Failures on Cargo Trains MA SK
Nils Schröder A unified Game Search Framework BA CW
Andreas Straninger Lernen von symbolischen Beschreibungen von Neuronalen Netzen durch Regeln MA FJ, ELM
Nathan Valenti An ensemblemethod for uninformed rollout heuristics in MCTS BA CW
Florian Weber Evaluating US College Rankings by College Score Card Data MA ext,CW
Manuel Weidmann Assessing app quality by means of weighted user ratings BA JF
Christoph Münker Erkennung von Fahrzeugpose und Fahrzeugklasse mit Convolutional Neural Nets MA ext, DQH

Legende

Art der Arbeit
DA ... Diplomarbeit
MA ... Masterarbeit
BA ... Bachelorarbeit
SA ... Studienarbeit
Betreuer
JF ... Johannes Fürnkranz
FJ ... Frederik Janssen HP ... Heiko Paulheim DQH ... Dang Quoc Hien
CW ... Christian Wirth ELM ... Eneldo Loza Mencia
TK ... FG Telekooperation AT ... Andrei Tolstikov SK ... Sebastian Kauschke

Themen im Detail

Keyword assignment at ULB

Ansprechpartner: JFELM

Aufgabe dieser Arbeit ist es, die Eignung bestehender Multilabel-Klassifikations-Algorithmen zur Beschlagwortung von Einträgen in einem aktuellen Katalogsauszug der ULB Darmstadt zu überprüfen. Zu den Aufgaben der Arbeit gehören eine geeignete Aufbereitung der Daten, die Definition des Lernproblems, und der Vergleich bestehender Algorithmen zur Lösung dieses Problems. Falls das Thema im Rahmen einer Master-Arbeit gewählt wird, können noch weiterführende Aufgaben hinzunehmen, wie z.B. der Einsatz von Verfahren zum sogenannten Zero-Shot-Learning, mit denen auch für Labels, die in den Trainingsdaten nicht vorkommen, Vorhersagen getroffen werden können.

Literatur:

  • Eneldo Loza Mencía, Johannes Fürnkranz: Efficient Pairwise Multilabel Classification for Large-Scale Problems in the Legal Domain. Proceedings ECML/PKDD (2), 2008:50-65

Multilabel Rule Learning

Ansprechpartner: FJ & ELM

Diese Arbeit setzt auf bisherigen Arbeiten zu diesem Themenbereich auf. Daher arbeiten Sie an einem aktuellen Forschungsthema. Zusätzlich zu den Credit Points winkt also eine Mit-Autorenschaft bei den weiteren geplanten Veröffentlichungen.

Thema:
Oftmals wird Regel-Lernen nur zum Lernen einer einzelnen Klasse eingesetzt. Multilabel-Klassifikation basiert hingegen auf der Annahme, dass ein Beispiel zu mehreren Klassen gehören kann. So kann beispielweise ein Zeitungsartikel sowohl über Sport als auch über Politik sein. Bisher gibt es so gut wie keine Verfahren, die eine Menge von Regeln lernen, die dann zur Multilabel Klassifikation eingesetzt werden können. Dies ist erstaunlich, das Regel-Lernverfahren den großen Vorteil haben, dass sie ein interpretierbares Modell liefern, sehr gut erforscht sind und außerdem eine extrem schnelle Klassifikation bieten.

Ein naheliegender Ansatz für dieses Problem ist die sog. Binary Relevance bei welcher man jede der Klassen des Labelvektors einzeln lernt und erst später eine Kombination findet, um eine echte Multilabel Klassifikation vorzunehmen. Dabei ist das größte Problem, dass man Abhängigkeiten der Klassen nicht berücksichtigt. Wenn also Klasse B beispielsweise immer dann vorkommt wenn auch Klasse A vorhanden ist, wird man dies bei der Binary Relevance Methode nicht feststellen, bzw. ausnutzen können.

Es gibt verschiedene Ideen, wie man einen am Fachgebiet vorhandenen Regel-Lerner auf Multilabel Klassifikation erweitern könnte. In dieser Arbeit sollen einige dieser Ansätze implementiert werden und dann sowohl gegeneinander als auch gegen Binary Relevance bzw. gegebenenfalls andere Algorithmen getestet werden.

Literatur:

Lernen von symbolischen Beschreibungen von Neuronalen Netzen durch Regeln

Ansprechpartner: FJ & ELM & JF

Neuronale Netze zeigen eine gute Perfomanz in Bezug auf die Genauigkeit. Ein großes Problem ist aber, dass man sie nicht gut interpretieren kann. Man ist zwar in der Lage, die Gewichte der Eingänge an jedem Neuron zu deuten, jedoch müssen diese nicht unbedingt ausschlaggebend sein, da es zumeist eine Reihe von Hidden Layern im Netzwerk gibt und die Netzwerke üblicherweise voll verdrahtet sind. Daher ist eine Idee neuronale Netze mit Regelmengen zu beschreiben, welche dann besser interpretierbar sind.
Diese Arbeit ist flexibel, kann also je nach Art im Umfang angepasst werden (Bachelorarbeit, Masterarbeit, Diplomarbeit, Forschungsprojekt, Studienarbeit etc.). Im Groben gibt es momentan vier Ideen, derartige Beschreibungen zu erstellen:

  1. Die Zielvariable im Trainingsdatensatz wird mit der Ausgabe des Netzes ersetzt. Dann wird wie gewohnt eine Regelmenge gelernt. Nun schaut man sich für jedes Beispiel an, welche Neuronen und welche Regeln für dieses feuern, um so eine "Karte" des Netzes zu erstellen (welche Regeln decken welche Regionen im Netz ab).
  2. Man legt die Klasse eines Beispiels am Ausgang des Netzes an und schaut sich an welche Eingänge für die derartige Ausgabe verantwortlich sind (Backpropagation). Da nicht nur ein Eingangssignal (Trainingsbeispiel) für den angelegten Zielwert in Frage kommt, muss man beispielsweise simulieren (Monte Carlo o.Ä.) um so z.B. Intervalle für die jeweiligen Features am Eingang zu erhalten. Basierend auf diesen Distributionen kann man nun versuchen, eine Regelmenge zu lernen, die diese widerspiegelt.
  3. Beim sog. Deep Learning von Neuronalen Netzen wird davon ausgegangen, dass Neuronen in den Hidden Layern versteckte Features darstellen. Nun kann man versuchen, jeden Layer mit einer Regelmenge zu beschreiben, also für den Inputlayer hätte man x -> h_1, für den ersten Hidden Layer dann h_1 -> h_2 bis man beim n-ten Hiddenlayer bei h_n -> y angelangt ist. Man erhält so für jeden Zwischenlayer eine symbolische Repräsentation.
  4. Bei ungeordneten Regelmengen ist die Frage, wie man die Vorhersagen der einzelnen Regeln aggregiert. Eine Möglichkeit anstelle von Standardverfahren wie Voting wäre die Aggregation zu lernen, indem man als Eingabe des Neuronalen Netzes die Regeln verwendet (Signal: gefeuert oder nicht). Das Netz würde nun lernen, welche Klasse abhängig vom Feuern welcher Regeln vorhergesagt wird. Dies könnte man dann als Aggregation verwenden.

Literatur

 

Pseudo-Nash-optimaler Computerspieler für 3-Spieler-Limit-Poker

Ansprechpartner: ELM
 

Eine Nash-optimale Spielweise bedeutet grob gesprochen, daß diese verlustminimierend ist. Die exakte Bestimmung einer solchen Strategie ist zwar prinzipiell möglich, jedoch für ein Spiel wie 2-Player (2P) Heads-Up Limit (noch) nicht vollständig lösbar, zumindest nicht in akzeptabler Zeit. Es ist jedoch möglich durch ein Verfahrens namens Counterfactual Regret Minimization (CRM) relativ effizient eine gute approximative Lösung zu berechnen. Diese Strategie wird auch von den momentan stärksten Pokerbots eingesetzt. Die Berechnung der pseudo Nash-optimalen Lösung beschränkt sich momentan leider auf 2P Spiele.

Im Rahmen der TUD Computer Poker Challenge im SS 11 wurde erstmals damit experimentiert, einen 2P CRM-Spieler für die 3-Spieler (3P) Variante des Spiels zu verwenden in dem z.B. bestimmte Spielzustände eines 2P-Spiels auf ein 3P-Spiel abgebildet werden. Dieses Verfahren wurde auch genauer im Rahmen einer Bachelor-Arbeit untersucht. Die Erkenntnis ist, daß sich die Abbildungen in bestimmten Situationen durchaus verwenden lassen, aber leider nicht in allen.

Ziel dieser Arbeit ist es deshalb, den CFR-Algorithmus selbst so anzupassen, daß dieser direkt (teilweise) auf 3P-Spiele anwendbar ist.

Für die Implementierung steht sowohl unser Poker Framework zur Verfügung, das die grundlegende Logik eines Pokerspielers implementiert und leicht Experimente ermöglicht, als auch die Implementierung des CFR-Algorithmus und der Source-Code vergangener Bots aus dem Praktikum.

Referenzen:

  • Martin Zinkevich, Michael Johanson, Michael Bowling, Carmelo Piccione: Regret Minimizationin Games with Incomplete Information, NIPS, 2007
  • Nick Abou Risk, Duane Szafron: Using Counterfactual Regret Minimization to Create Competitive Multiplayer Poker Agents, AAMAS, 2010
  • Peter Glöckner: Abbildung eines 2-Spieler Computerspielers auf 3-Spieler-Limit-Poker, 2013
A A A | Drucken | Impressum | Sitemap | Suche | Mobile Version
zum Seitenanfangzum Seitenanfang