$S^3$: Stratifizierte Skalierungssuche für Test-Zeit in Diffusions-Sprachmodellen
Test-Zeit-Skalierung untersucht, ob ein festgelegtes Diffusions-Sprachmodell bessere Ausgaben generieren kann, wenn mehr Inferenz-Rechenleistung gegeben wird, ohne zusätzliches Training. Allerdings ist naives Best-of-$K$-Sampling fundamental begrenzt…