Zur nächsten Grenze von LLMs, Training auf privaten Daten: Ein Cross-Domain-Benchmark für föderiertes Fine-Tuning

arXiv:2605.13936v1 Ankündigungstyp: neu Abstract: Der jüngste Erfolg großer Language Models wurde weitgehend durch umfangreiche öffentliche Datensätze getrieben. Die nächste Grenze für LLM-Entwicklung liegt jedoch jenseits öffentlicher Daten. Ein großer Teil der wertvollsten Informationen der Welt ist privat, besonders in hochregulierten…