Einfache Stabilisierung der Schleife durch vollständig geschlungenen Transformer

arXiv:2605.18797v1 Ankündigungstyp: neu Abstract: Die Skalierung der Modell-Performance erfordert typischerweise eine Vergrößerung des Modells. Looped Transformer bietet eine überzeugende Alternative durch iteratives Wiederverwenden derselben Transformer-Blöcke, wobei zusätzliche Berechnung gegen verbesserte Performance ohne Parametervergrößerung