14-05-2026
arXiv AI+ML
🔬 Forschung

Träumen Androiden davon, das Spiel zu brechen? Systematische Überprüfung von AI Agent Benchmarks mit BenchJack

arXiv:2605.12673v1 Ankündigungstyp: neu Abstract: Agent Benchmarks sind zum de-facto Standard für die Messung von Frontier-AI-Kompetenz geworden und leiten Modellauswahl, Investitionen und Deployment. Allerdings tritt Reward Hacking, bei dem Agenten einen Score maximieren, ohne die beabsichtigte Aufgabe auszuführen, spontan bei Frontier auf

Originalartikel lesen bei arXiv AI+ML →

#ki #forschung #cybersecurity