Schwach überwachte Destillation von Halluzinations-Signalen in Transformer-Darstellungen

Bestehende Halluzinationserkennung-Methoden für große Sprachmodelle verlassen sich auf externe Verifikation zur Inference-Zeit und erfordern Gold-Answers, Retrieval-Systeme oder zusätzliche Judge-Modelle. Wir fragen, ob diese externe Supervision stattdessen destilliert werden kann…