Entwicklung und Vergleich von Modellen zur synthetischen Datengenerierung für On-Board-Diagnose-Daten

  • Forschungsthema:Machine learning, On-Board Diagnostics, Synthetic data generation
  • Typ:Bachelorarbeit
  • Datum:ab 07 / 2023
  • Betreuung:

    M.Sc. Veljko Vucinic (RA Consulting)

    M. Sc. Marco Stang (ITIV)

  • Zusatzfeld:

    RA Consulting Bruchsal. Hybridarbeiten nach Absprache möglich. Kontaktaufnahme zum Projektbetreuer bitte nur auf Englisch.

Entwicklung und Vergleich von Modellen zur synthetischen Datengenerierung für On-Board-Diagnose-Daten

RA Consulting GmbH
RA Consulting GmbH

Kontext 

Daten spielen beim maschinellen Lernen (ML) eine wichtige Rolle, da sie die Grundlage für das Training und die Verbesserung von ML-Modellen bilden. In realen Systemen wie On-Board-Diagnose (OBD) kann die Implementierung von ML durch die schlechte Qualität und begrenzte Menge an Daten beeinträchtigt werden, was zu einer unzureichenden Anpassung der ML-Modelle führen kann. OBD-Systeme haben das Potenzial, die Haltbarkeit und Zuverlässigkeit von Fahrzeugen zu verbessern, indem sie KI-basierte Analysen, vorausschauende Diagnosen, vorausschauende Wartung usw. nutzen. Die Erfassung einer großen Menge von OBD-Daten, wie z. B. SAE J1699 Compliance Test Log-Dateien, stellt jedoch eine Herausforderung dar, da das Risiko besteht, dass sensible Informationen preisgegeben werden. Um dieses Problem zu lösen, bietet die Erzeugung synthetischer Daten eine vielversprechende Alternative. Durch die Erstellung synthetischer Daten ist es möglich, große Mengen an OBD-Daten zu generieren, die für das Training hochwertiger ML-Modelle verwendet werden können. Die Generierung synthetischer Daten ermöglicht die freie Nutzung großer Mengen von OBD-Daten und gewährleistet die Sicherheit und den Schutz der sensiblen Kundeninformationen.

Ziele

  • Stand der Technik bei Modellen zur Erzeugung synthetischer Daten
  • Untersuchung der wichtigsten Attribute von On-Board-Diagnose-Daten, mit Schwerpunkt auf SAE J1699 Data Log-Dateien
  • Erfolgreiche Implementierung des geeigneten synthetischen Datengenerierungsmodells
  • Forschung und Entwicklung des Auswertungskonzeptes für synthetisch erzeugte Daten

Voraussetzungen 

  • Interesse an der Entwicklung von KI/ML-Systemen
  • Grundkenntnisse und Erfahrung in der Datenverarbeitung
  • Programmierkenntnisse (Python/C++)

Wir von RA Consulting sind bereit, die Zusammenarbeit mit Ihnen nach Ihrer Bachelorarbeit durch ein zukünftiges Praktikum und/oder eine Masterarbeit fortzusetzen!