09-04-2026
arXiv AI+ML
🔬 Forschung

Schwach überwachte Destillation von Halluzinations-Signalen in Transformer-Darstellungen

Bestehende Halluzinationserkennung-Methoden für große Sprachmodelle verlassen sich auf externe Verifikation zur Inference-Zeit und erfordern Gold-Answers, Retrieval-Systeme oder zusätzliche Judge-Modelle. Wir fragen, ob diese externe Supervision stattdessen destilliert werden kann…

Originalartikel lesen bei arXiv AI+ML →

#llm #forschung