Abschlussarbeit Data Science: Untersuchung der Anomalie-Detektionsleistung einer rückgekoppelten Datenselektion im Automotive Kontext
- Forschungsthema:Data Science/Big Data
- Typ:Masterarbeit
- Datum:ab 02 / 2026
- Betreuung:
Abschlussarbeit Data Science: Untersuchung der Anomalie-Detektionsleistung einer rückgekoppelten Datenselektion im Automotive Kontext
Kontext
Moderne Fahrzeuge erzeugen während der Fahrt sehr große Datenmengen (bis zu 2,5 GB/s). Da das vollständige Speichern und Übertragen dieser Daten extrem teuer ist, werden zunehmend Verfahren zur intelligenten Datenselektion eingesetzt, die redundante Daten reduzieren und gleichzeitig relevante seltene Inhalte (Corner Cases) erhalten.
Ein vielversprechender Ansatz ist die rückgekoppelte Datensammlung1: Dabei wird kontinuierlich ein Modell über bereits gespeicherte Daten aufgebaut, welches neu eintreffende Daten nach ihrem Neuigkeitswert bewertet und entscheidet, ob diese gespeichert werden sollen.
Neben Diversität und Redundanzreduktion spielt insbesondere die Erkennung seltener Ereignisse eine zentrale Rolle, etwa Anomalien, Out-of-Distribution (OOD) Situationen oder Corner Cases. In hochdimensionalen Systemen ist jedoch die Definition von „Anomalie“ nicht trivial. Anomalien lassen sich u. a. nach weak/strong sowie trivial/nicht-trivial unterscheiden. In dieser Arbeit soll untersucht werden, ob und wie eine rückgekoppelte Datensammlung gezielt zur Anomalie-Detektion genutzt werden kann und welche Grenzen dabei auftreten.
Aufgaben
-
Einarbeitung in rückgekoppelte Datensammlung für Fahrzeugdaten
-
Einarbeitung in den Stand der Technik der Anomalie- und OOD-Erkennung im hochdimensionalen Kontext
-
Ableitung eines Evaluationskonzepts inkl. geeigneter Metriken
-
Untersuchung, wie sich rückgekoppelte Datensammlung als Anomaliedetektor verhält
-
Ableitung von Empfehlungen, ob und wie Rückkopplungssysteme zur robusten Anomalieerkennung in Fahrzeugdaten geeignet sind
Voraussetzungen
-
Du arbeitest selbständig und strukturiert, bist motiviert und engagiert.
-
Python Kenntnisse
-
Du besitzt sehr gute Deutsch- und Englischkenntnisse in Wort und Schrift.
-
Kenntnisse in Machine Learning / Statistik, optimalerweise in Streaming Algorithmen und Anomalieerkennung/Verteilungsschätzungen
