Latent Cache Flow: Modell-zu-Modell-Kommunikation ohne Text
arXiv:2605.22863v1 Ankündigung Typ: neu Abstract: LLM-Agenten kommunizieren heute über Text, was erhebliche Latenz und Informationsverluste verursacht, da der ausgebende Modell dekodiert und der empfangende Modell kodiert werden muss. Jüngste Arbeiten wie Cache-to-Cache (C2C; Fu et al., 2026