zur Suche

Darmstadt: Masterarbeit: Aktuelle Backdoor Detektionsverfahren angreifen

Jetzt bewerben

Stellenbeschreibung

Abschlussarbeit
Homeoffice: Nach Absprache

Hintergrund/Motivation: 
Backdoor Attacken sind Angriffe auf Neuronale Netze bei denen ein sogenannter Trigger das Entscheidungsverhalten der Netze verändert und dadurch Schwachstellen entstehen. Diese Trigger können in den Trainingsdatensatz eingeschleust werden oder direkt auf die Modellgewichte. Diese nennt man dann vergiftet. Durch Parametereffiziente Finetuning Methoden sind Backdoor Angriffe auf Large Language Modelle (LLMs) wesentlich schwieriger zu detektieren geworden, da ein vergiftetes Parameterupdate schwieriger zu erkennen ist als ein vergifteter Datensatz. Daher wurden in der vergangenen Zeit einige Verfahren entwickelt um vergiftete Modelupdates zu erkennen.

Ziel:  Durch die Vielfalt der Backdoor Angriffe können Verfahren oft weitaus weniger Angriffe erkennen als sie vorgeben, da sie oft Annahmen treffen, die nicht der Realität entsprechen. Ziel dieser Arbeit ist es daher, bei Verfahren die in der Literatur vorgestellt wurden, Schwachstellen zu finden und auszunutzen, sodass versprochene Effekte doch nicht wie gewünscht erreicht werden.

Ergebnisse: Die Ergebnisse dieser Arbeit sollen der Forschungscommunity aufzeigen, dass ein grundlegendes Verständnis von den Mechaniken von Backdoor Angriffen zwingend erforderlich ist. Dafür sollen für vorher ausgewählte Detektionsverfahren Modelle, Datensätze oder Finetuning Adapter erstellt und getestet werden, die zuverlässig diese Detektionsverfahren umgehen können.

Hier sorgst Du für Veränderung

  • Forschen und Implementieren von neuartigen Machine Learning Ansätzen, die die Sicherheit von LLMs steigern.
  • Selbstkritische Evaluierung der gefunden Ergebnisse.
  • Präsentieren der Ergebnisse.
  • Anfertigen eines Projektberichts in Form einer Masterarbeit.

Hiermit bringst Du Dich ein

  • Kenntnisse im Bereich Machine Learning darunter Training, Inferenz und Optimierung von Transformerarchitekturen.
  • Kenntnisse im Bereich ML-Security sind wünschenswert.
  • Gute Python Kenntnisse im speziellen mit Pytorch sind erforderlich.
  • Wissenschaftliches Interesse und Interesse an aktuellen Forschungsprojekten.

Was wir für Dich bereithalten

  • Selbstständige Arbeitszeiteinteilung
  • Einblicke in das Schnittfeld von akademischer Forschung und industrieller Anwendung

Verwandte Arbeiten:
[1] (Relevante Abschnitte: 2.7, 3.5, 3.6)
[2]
[3]
[4]

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt. Unsere Aufgaben sind vielfältig und anpassbar – für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern.

Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft. 

Bereit für Veränderung? Dann bewirb Dich jetzt, und mach einen Unterschied! Nach Eingang Deiner Online-Bewerbung erhältst Du eine automatische Empfangsbestätigung. Dann melden wir uns schnellstmöglich und sagen Dir, wie es weitergeht. 

Fraunhofer-Institut für Sichere Informationstechnologie SIT

Kennziffer: 82689                Bewerbungsfrist: 

Anstellungsart
Abschlussarbeit
Homeoffice
Nach Absprache
Standort
64283 Darmstadt

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Bitte .