Kalibrierte Unsicherheit aus Language-Model-Trajektorien auslesen

arXiv:2605.22864v1 Ankündigung Typ: neu Abstract: Die maximale Softmax-Wahrscheinlichkeit (MSP) stellt einen Standardansatz bei der Evaluierung von Unsicherheitsquantifizierung für Language-Model-Generierung mit strukturierter Ausgabe dar. Obwohl kostengünstig, ist sie oft fehlkalibriert. Methoden, die die internen Aktivitäten des Modells untersuchen