Max-Window-Skalierungsschätzung für Near-Lossless HiF8 W8A8 Quantisierungsbewusstes Training
arXiv:2605.26189v1 Ankündigungstyp: neu Abstract: Quantisierungsbewusstes Training (QAT) mit Low-Bit-Gleitkommaformaten ermöglicht effiziente LLM-Bereitstellung, führt aber zu subtilen Ausfallmodi, die für Standard-Trainingsmetriken unsichtbar sind. Wir präsentieren eine systematische Studie von HiF8 W8A8 QAT für OpenPangu-Embedded-1B