Am Fraunhofer-Institut für Software- und Systemtechnik ISST in Dortmund leisten wir mit rund 170 Mitarbeitenden angewandte Spitzenforschung für den Digitalisierungsstandort Europa. Wir helfen Wirtschaft und Gesellschaft dabei, Daten souverän in Datenräumen (Data Spaces) zu teilen und ihren Wert voll auszuschöpfen - zum Beispiel im Gesundheitswesen, in der industriellen Fertigung oder mit Blick auf die Mobilität in smarten Städten. Wann gibst Du Daten neue Räume?
Die Qualität von Daten spielt eine zentrale Rolle für die Zuverlässigkeit von Analysen und Entscheidungsprozessen. Hochwertige Daten ermöglichen präzise Vorhersagen und fundierte Entscheidungen. Manchmal stehen reale Daten jedoch nicht zur Verfügung oder dürfen aus Datenschutzgründen nicht verwendet werden. In solchen Fällen werden synthetische Daten eingesetzt, die künstlich erzeugt werden, um reale Daten zu simulieren. Doch wie gut entsprechen diese synthetischen Daten der Realität? Kann ihre Qualität mit der von echten Daten mithalten und können synthetische Daten auch komplexe Muster der realen Welt abbilden?
Du befindest Dich am Ende Deines Masterstudiums, interessierst Dich für solche wegweisenden Fragestellungen und suchst einen unterstützenden Praxispartner mit einem hochrelevanten Thema für Deine Abschlussarbeit? Dann schreibe deine Masterarbeit bei uns zum Thema »Untersuchung des Einflusses synthetischer Daten auf die Datenqualität«. Als Masterand*in bist Du Teil unserer Abteilung »Mobility & Smart Cities«, in der wir mit datengetriebenen, innovativen Lösungen die Mobilität und Städte der Zukunft gestalten.
Ziel Deiner Masterarbeit: den Einfluss synthetischer (künstlich erzeugter) Daten auf die Datenqualität erforschen und deren Einsatzmöglichkeiten optimieren. Dabei profitierst Du von unserer intensiven Betreuung und großen Expertise.
Mögliche Aufgaben im Rahmen der Masterarbeit:
Datenqualität verstehen und definieren: Du identifizierst und analysierst gängige Metriken zur Bewertung der Datenqualität und entwickelst Methoden, um diese zu bestimmen. Dabei legst Du Datenqualitätsregeln fest, die als Grundlage für die Messung und Sicherstellung der Datenqualität dienen.
Synthetische Daten generieren und bewerten: Du erforschst Verfahren, mit denen aus realen Datensätzen synthetische Daten generiert werden können. Anschließend wendest Du die festgelegten Metriken und Regeln an, um zu messen, wie sich die Datenqualität zwischen den realen und synthetischen Daten verändert und welche praktischen Konsequenzen dies für die Nutzung der Daten hat.
Modellperformance vergleichen: Du untersuchst, ob Modelle, die mit synthetisch generierten Daten trainiert wurden, weniger gut performen als solche, die auf realen Daten basieren. Diese Analyse hilft dabei, die Auswirkungen der Datenqualität auf die Modellgenauigkeit zu verstehen. So kann die Eignung synthetischer Daten für verschiedene Anwendungsfälle bewertet werden.
Die Aufgaben dienen als Leitfaden und sind nicht als starre Vorgaben zu verstehen. Die finale Ausarbeitung des Themas erfolgt individuell, basierend auf Deinen persönlichen Interessen und in enger Abstimmung mit dem betreuenden Dozenten.
Ein laufendes Masterstudium in Informatik, Angewandte Informatik, Wirtschaftsinformatik, Data Science, Software-Engineering, Wirtschaftsingenieurwesen, Wirtschaftswissenschaften, Mathematik oder einer vergleichbaren Fachrichtung
Gute Programmierkenntnisse in mindestens einer gängigen Programmiersprache (z. B. Python, Java, Rust, Go)
Grundlegende Kenntnisse im Bereich Software-Engineering und Datenqualität
Interesse an innovativen Technologien, datengetriebenen Lösungen und angewandter Forschung
Einen teamorientierten, sorgfältigen und eigenverantwortlichen Arbeitsstil sowie die Fähigkeit zur selbstständigen, wissenschaftlichen Arbeit
Gutes Deutsch und Englisch in Wort und Schrift
Zukunftsgestaltende Aufgaben: Deine Masterarbeit ist nicht nur ein wichtiger Teil Deiner akademischen Karriere, sondern auch eine Chance, an einem relevanten Thema der digitalen Zukunft mitzuarbeiten.
Betreuung und Unterstützung: Du wirst von unseren erfahrenen Expert*innen eng betreut, erhältst wertvolle Einblicke und kannst Deine Arbeit mit unserer Hilfe weiterentwickeln.
Flexibilität: Arbeite dort, wo Du am besten produktiv bist - komplett remote oder vor Ort in unserem Institut in Dortmund. Nur zum Abholen und Zurückgeben der Hardware und Smartcard müsstest Du je 1x zu uns ins Institut nach Dortmund kommen.
Ein offenes und kreatives Arbeitsumfeld: Bei uns erwartet Dich ein engagiertes Team und viel Freiraum für Deine eigenen, kreativen Ideen oder Themenvorschläge. Flache Hierarchien und eine offene Atmosphäre sorgen dafür, dass Du Dich schnell bei uns einlebst.