Technischer Bericht: Activation Residual Hessian Quantization (ARHQ) für Low-Bit LLM Quantisierung
arXiv:2605.00140v1 Ankündigungstyp: neu Abstract: Wir präsentieren Activation Residual Hessian Quantization (ARHQ), eine Post-Training Weight-Splitting Methode, die Fehlerausbreitung in Low-Bit Activation-Weight Quantisierung mindert. Durch die Konstruktion eines eingangsseitigen residualen Hessian aus Aktivierungsquantisierung…