SAT: Sequential Agent Tuning für Coordinator-freies Plug-and-Play Multi-LLM-Training mit monotonen Verbesserungsgarantien

arXiv:2605.05216v1 Ankündigungstyp: neu Abstract: Large Language Models (LLMs) mit einer großen Anzahl von Parametern erzielen starke Leistungen, sind aber oft prohibitiv teuer einzusetzen. Jüngste Arbeiten untersuchen die Verwendung von Teams kleinerer, effizienterer LLMs, die gemeinsam ein