ITBench-AA: Frontier Models schneiden unter 50% bei erstem Benchmark für Agentic Enterprise IT-Aufgaben ab – von Artificial Analysis und IBM
ITBench-AA: Frontier Models schneiden unter 50% bei erstem Benchmark für Agentic Enterprise IT-Aufgaben ab – von Artificial Analysis und IBM