ARBITER: Reasoning-Trajektorienbecken und Mehrheitsvotum-Ausfälle bei Test-Zeit-Sampling
arXiv:2605.26172v1 Ankündigungstyp: neu Abstract: Wenn Sprachmodelle Test-Zeit-Sampling verwenden, generieren sie mehrere Reasoning-Trajektorien und wählen eine Antwort durch Mehrheitsvotum. Wir zeigen, dass diese Trajektorien nicht unabhängig sind: für eine gegebene Frage konzentrieren sie sich auf eine kleine Anzahl von Clustern