TeamTR: Trust-Region Fine-Tuning für Multi-Agent LLM-Koordination
arXiv:2605.15207v1 Ankündigungstyp: neu Zusammenfassung: Multi-Agent LLM-Systeme haben für komplexes Reasoning Potenzial gezeigt, doch neuere Evaluationen zeigen, dass sie oft hinter Single-Model-Baselines zurückbleiben. Wir identifizieren einen strukturellen Fehlermodus beim sequenziellen Fine-Tuning von Shared-Context-Teams: Das Aktualisieren eines Agenten