Erkunden und Ausbeuten-Fehler sind messbar für Language-Model-Agenten

arXiv:2604.13151v1 Language-Model (LM) Agenten werden zunehmend bei komplexen, offenen Entscheidungsaufgaben eingesetzt, von AI-Coding bis zu Physical AI. Eine Grundvoraussetzung in diesen Szenarien ist die Fähigkeit, sowohl den Problemraum zu erkunden als auch erworbenes Wissen effektiv auszunutzen.