Block-basierte Double Decoders

arXiv:2605.18807v1 Ankündigungstyp: neu Abstract: Encoder-Decoder-Modelle bieten erhebliche Inferenz-Zeit-Einsparungen gegenüber reinen Decoder-Modellen, doch ihre Pretraining-Ziele leiden unter spärlicher Supervision und dynamischen Sequenzlängen, was sie in der Praxis in großem Maßstab unpraktisch macht. Wir schlagen block-basierte double