Mehr Denken, mehr Bias: Längen-getriebener Positions-Bias in Reasoning-Modellen

arXiv:2605.06672v1 Chain-of-Thought (CoT) Reasoning und Reasoning-abgestimmte Modelle wie DeepSeek-R1 werden häufig angenommen, oberflächliche heuristische Biases durch sorgfältiges Denken zu reduzieren. Wir testen dies beim Positions-Bias in Multiple-Choice-QA und finden eine andere Geschichte: