KI-Benchmarks sagen wenig über echte Leistung aus – was wirklich getestet werden sollte
Einmalige Benchmark-Tests für KI geben kaum Aufschluss über die tatsächlichen Fähigkeiten großer Sprachmodelle. Statt Objektivität ebnen sie den Weg für eine verhängnisvolle Kluft, meint unsere Expertin für KI-Tools und Professorin an der Stanford University.weiterlesen auf t3n.de