SaFeR-Steer: Weiterentwicklung von Multi-Turn MLLMs via Synthetic Bootstrapping und Feedback Dynamics
arXiv:2604.16358v1 MLLMs werden zunehmend in Multi-Turn Umgebungen eingesetzt, wo Angreifer unsicheres Intent durch die evolvierende visuell-textuelle Historie eskalieren und den Sicherheitsverfal bei langen Kontexten ausnutzen können. Doch Safety Alignment wird noch von Single-Turn Daten dominiert