Darmstadt: Masterarbeit: Faire und ausbalancierte Altersschätzung durch dynamisches, gruppenweises Training

64283 Darmstadt

Jetzt bewerben

Stellenbeschreibung

Abschlussarbeit

Homeoffice: Nach Absprache

Hintergrund/Motivation:
Gesichtbasierte Altersschätzung ist in vielen Anwendungen zentral, wie z.B. in der Kriminalitätsbekämpfung, Identitätsverifizierung, Jugendschutz und auch im medizinischen Bereich. Systeme zur Altersschätzung zeigen häufig unterschiedliche Performance auf Subgruppen (z.B. bzgl. Alter, Geschlecht, ethnische Zugehörigkeit). Gründe sind auf der einen Seite die Verfügbarkeit bzw. Ausgewogenheit der Trainingsdaten und auf der anderen Seite klassische Trainingsverfahren, die globale Metriken optimieren und Probleme in gewissen Subgruppen ignorieren.
Techniken wie Oversampling oder probabilistisches Sampling versuchen durch eine statistische Analyse im Vorhinein eine Balanciertheit der Trainingsdaten zu erzeugen mit der Hoffnung, dass dies eine gleichmäßige Performance auf allen Subgruppen erzeugt. Das Ergebnis der Maßnahme fließt jedoch üblicherweise nicht zurück in den Trainingsprozess, dieser bleibt davon unberührt.

Ziel:
Ziel dieser Masterarbeit ist die Entwicklung und systematische Evaluation von Trainingstrategien, die dynamisch zur Laufzeit abhängig von der momentanen Performance auf den Subgruppen den Trainingsprozess anpassen.

Dazu sollen:

während des Trainings subgruppen-spezifische Metriken berechnet und zur Steuerung genutzt werden.
Strategien entwickelt und implementiert werden: dynamisches Oversampling schwacher Subgruppen, Sampling nach Unsicherheit (uncertainty sampling), sowie Curriculum-Strategien (zuerst allgemein/leicht, dann spezifisch/schwer).
geeignete Aggregationsmetriken über die Subgruppen untersucht werden (z.B. Worst-Group-Performance, harmonisches Mittel, Quantile statt Macro-Average).
Vergleiche mit Baselines wie klassischem Oversampling, probabilistischem Sampling, GroupDRO [1] und JTT [2] durchgeführt werden.
AutoML/Hyperparameter-Suche zur Exploration von Kombinationsmöglichkeiten eingesetzt werden.

Ergebnisse:
Die entwickelten Verfahren sollen es erlauben, ausgeglichene, aber auch spezialisierte Computer-Vision-Modelle zu trainieren, insbesonderen im Bereich der gesichtsbasierten Altersschätzung. Es werden geeignete und erfolgreiche Maßnahmen präsentiert, Leitlinien, wann welche Strategie (oder Kombination) wirkt, aber auch Einschränkungen, Fallstricke und unerwartete Ergebnisse. Die Verfahren werden anhand von frei verfügbaren Benchmark-Datensätzen evaluiert und mit existierenden Verfahren verglichen. Der verwendete Code ist gut dokumentiert, wiederverwendbar und die Ergebnisse sind reproduzierbar.

Hier sorgst Du für Veränderung

Recherchieren und Zusammenstellen von Informationen zu einem aktuellen Thema aus dem Bereich maschinelles Lernen.
Forschen und Implementieren von neuartigen Machine-Learning- und Computer-Vision-Ansätzen.
Selbstkritische Evaluierung der gefundenen Ergebnisse.
Präsentieren der Ergebnisse.
Anfertigen einer wissenschaftlichen Arbeit in Form einer Masterarbeit mit den Ergebnissen.

Hiermit bringst Du Dich ein

Gute Kenntnisse im Bereich Machine Learning und dem Training neuronaler Netze.
Idealerweise Kenntnisse in Computer-Vision und Gesichtserkennung.
Gute Python-Kenntnisse, vorzugsweise erste Erfahrung mit PyTorch, OpenCV etc.
Motivation, sich eigenständig in neue und aktuelle Forschungsthemen einzuarbeiten.
Interesse an Robustheit und Evaluationsmetriken.
Interesse an wissenschaftlicher Forschung.

Was wir für Dich bereithalten

Selbstständige Arbeitszeiteinteilung
Einblicke in das Schnittfeld von akademischer Forschung und industrieller Anwendung

Verwandte Arbeiten:
[1] Sagawa et al., Distributionally Robust Neural Networks for Group Shifts (GroupDRO)
[2] Liu et al., Just Train Twice: Improving Group Robustness Without Training Group Information (JTT)
[3] Hacohen, Weinshall (2019). On the Power of Curriculum Learning in Training Deep Networks
[4] Roh et al., FairBatch: Batch Selection for Model Fairness —
[5] Ren et al., Learning to Reweight Examples for Robust Deep Learning —
[6] Cui et al., Class-Balanced Loss Based on Effective Number of Samples —
[7] Hashimoto et al., Fairness Without Demographics in Repeated Loss Minimization —

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt. Unsere Aufgaben sind vielfältig und anpassbar – für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern.

Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft.

Bereit für Veränderung? Dann bewirb Dich jetzt, und mach einen Unterschied! Nach Eingang Deiner Online-Bewerbung erhältst Du eine automatische Empfangsbestätigung. Dann melden wir uns schnellstmöglich und sagen Dir, wie es weitergeht.

Fraunhofer-Institut für Sichere Informationstechnologie SIT

Kennziffer: 82685 Bewerbungsfrist:

Anstellungsart

Abschlussarbeit

Homeoffice

Nach Absprache

Standort

64283 Darmstadt

Jetzt bewerben