LLMs glauben falschen Aussagen auch nach expliziten Warnungen

Fine-Tuning-Tests zeigen “Neigung, die Aussagen zuversichtlich als wahr darzustellen”