Quantization Undoes Alignment: Bias-Entstehung in komprimierten LLMs über Modelle und Präzisionsstufen hinweg

arXiv:2605.15208v1 Ankündigungstyp: neu Zusammenfassung: Large Language Models werden routinemäßig durch Post-Training-Quantisierung komprimiert, um Inferenzkosten und Speicherfußabdruck für Cloud- und Edge-Deployment zu reduzieren, doch die Auswirkungen dieser Komprimierung auf die Modellqualität bleiben schlecht verstanden. Bestehende Studien