Abschlussarbeit Data Science: Robustheitsanalyse einer rückgekoppelten Online-Datenselektion für den Live-Einsatz im Fahrzeug
- Forschungsthema:Data Science/Big Data
- Typ:Masterarbeit
- Datum:ab 02 / 2026
- Betreuung:
Abschlussarbeit Data Science: Robustheitsanalyse einer rückgekoppelten Online-Datenselektion für den Live-Einsatz im Fahrzeug
Kontext
Moderne Fahrzeuge erzeugen während der Fahrt sehr große Datenmengen (bis zu 2,5 GB/s). Das vollständige Speichern, Übertragen und Verarbeiten dieser Daten ist in der Praxis kostenintensiv und häufig nicht skalierbar. Gleichzeitig sind diese Daten essenziell für datengetriebene Methoden wie Machine Learning.Da Fahrzeugdaten typischerweise einer Long-Tail-Verteilung folgen, sind viele Datenpunkte redundant, während seltene Situationen (Corner Cases, Anomalien) nur sehr selten auftreten. Eine rückkopplungsgesteuerte Datensammlung adressiert dieses Problem, indem ein Modell auf Basis bereits gesammelter Daten den Neuigkeitswert neuer Daten bewertet, um gezielt diverse und informative Daten zu speichern und Redundanz zu vermeiden. Der aktuell eingesetzte Ansatz basiert auf der Annahme eines gaußverteilten Eingangsdatenstroms. In realen Fahrdaten ist diese Annahme jedoch oft verletzt (z. B. temporale Redundanzen, nicht-stationäre Verteilungen, Multi-Modalität). In dieser Arbeit soll daher die Robustheit des Rückkopplungsmechanismus systematisch untersucht und verbessert werden.
Aufgaben
-
Einarbeitung in rückgekoppelte Datensammlung für Fahrzeugdaten
-
Recherche von Robustheitsansätzen und Bewertung ihrer Übertragbarkeit auf eine rückgekoppelte Datensammlung
-
Integration einer Methode in ein rückgekoppelte Datensammlungsframework
-
Vergleich Verfahren für eine rückgekoppelte Datensammlung
Voraussetzungen
-
Du arbeitest selbständig und strukturiert, bist motiviert und engagiert.
-
Python Kenntnisse
-
Du besitzt sehr gute Deutsch- und Englischkenntnisse in Wort und Schrift.
-
Kenntnisse in Machine Learning / Statistik, optimalerweise in Streaming Algorithmen und Anomalieerkennung/Verteilungsschätzungen
