18-05-2026
arXiv AI+ML
🔬 Forschung

Fair Outputs, Biased Internals: Kausale Potenz und Asymmetrie von Latent Bias in LLMs für hochriskante Entscheidungen

arXiv:2605.15217v1 Ankündigungstyp: neu Zusammenfassung: Instruction-Tuned Language Models zeigen Verhaltensgerechtigkeitsgedanken in hochriskanten Entscheidungen, während sie voreingenommene Assoziationen in ihren internen Darstellungen behalten. Ob diese unterdrückten Darstellungen jedoch die Modellausgaben beeinflussen können - und ob solche

Originalartikel lesen bei arXiv AI+ML →

#ki #llm #datenschutz