Eine Maske, um sie alle zu beherrschen: Über verborgene Fakten nach dem Editieren und wie man sie findet

arXiv:2605.28839v1 Ankündigungstyp: neu Zusammenfassung: Knowledge-Editing-Methoden wie ROME und MEMIT aktualisieren faktische Assoziationen in Transformer-Modellen durch Änderung von MLP-Gewichten. Obwohl hauptsächlich durch Ausgabeverhalten bewertet, bleibt ihr interner Mechanismus untersucht. Wir untersuchen, ob Änderungen auf