CreativityBench: Evaluierung kreativer Agent-Reasoning via Affordanz-basierter Werkzeug-Zweckentfremdung

arXiv:2605.02910v1 Ankündigungstyp: neu Abstract: Jüngste Fortschritte bei großen Sprachmodellen haben zu starker Leistung bei Reasoning- und Umgebungsinteraktions-Aufgaben geführt, doch ihre Fähigkeit zur kreativen Problemlösung bleibt untererforscht. Wir untersuchen diese Fähigkeit durch die Linse der kreativen Werkzeugnutzung