Träumen Androiden davon, das Spiel zu brechen? Systematische Überprüfung von AI Agent Benchmarks mit BenchJack

arXiv:2605.12673v1 Ankündigungstyp: neu Abstract: Agent Benchmarks sind zum de-facto Standard für die Messung von Frontier-AI-Kompetenz geworden und leiten Modellauswahl, Investitionen und Deployment. Allerdings tritt Reward Hacking, bei dem Agenten einen Score maximieren, ohne die beabsichtigte Aufgabe auszuführen, spontan bei Frontier auf