Focus Session: Hardware- und Software-Techniken zur Beschleunigung von Multimodal Foundation Models

arXiv:2604.21952v1 Announcement Type: neu Abstract: Diese Arbeit präsentiert eine mehrstufige Methodik zur effizienten Beschleunigung von Multimodal Foundation Models (MFMs). Sie kombiniert Hardware- und Software-Kodesign von Transformer-Blöcken mit einer Optimierungs-Pipeline, die Rechen- und Speicheranforderungen reduziert