Die Readout-Abkürzung: Positionelles Zahlen-Kopieren dominiert Arithmetic CoT Readout in kleinen Language Models
arXiv:2605.22870v1 Ankündigung Typ: neu Abstract: Chain-of-Thought (CoT) Prompting ist notwendig für Arithmetik in kleinen Language Models, doch das Mischen seiner Schritte bewahrt die meiste Leistung. Was trägt CoT bei, wenn nicht logische Sequenzierung? In drei 1-3B Instruction-tuned LMs auf GSM8K isolieren wir