21-04-2026
arXiv AI+ML
🔬 Forschung

SaFeR-Steer: Weiterentwicklung von Multi-Turn MLLMs via Synthetic Bootstrapping und Feedback Dynamics

arXiv:2604.16358v1 MLLMs werden zunehmend in Multi-Turn Umgebungen eingesetzt, wo Angreifer unsicheres Intent durch die evolvierende visuell-textuelle Historie eskalieren und den Sicherheitsverfal bei langen Kontexten ausnutzen können. Doch Safety Alignment wird noch von Single-Turn Daten dominiert

Originalartikel lesen bei arXiv AI+ML →

#ki #cybersecurity