Steuerung ohne Beschädigung: Mechanistisch informierte Interventionen für diskrete Diffusions-Sprachmodelle
arXiv:2605.10971v1 Ankündigungstyp: neu Zusammenfassung: Diskrete Diffusions-Sprachmodelle (DLMs) generieren Text durch iteratives paralleles Entrauschen aller Positionen und bieten eine Alternative zu autoregressiven Modellen. Kontrollierte Generierungsmethoden für DLMs, die von autoregressiven Modellen übernommen wurden, wenden einheitliche Interventionen an