Mathematik braucht zwei: Ein Test für emergentes mathematisches Reasoning in der Kommunikation
arXiv:2604.21935v1 Announcement Type: neu Abstract: Obwohl Sprachmodelle bemerkenswerte Leistungen bei mathematischen Benchmarks zeigen, bleibt unklar, ob dies echtes mathematisches Reasoning oder statistische Mustererkennung über das Erlernen formaler Syntax widerspiegelt. Die meisten vorhandenen Evaluationen basieren auf