Ein struktureller Schwellwert in der Entscheidungskapazität bestimmt den Zusammenbruch im Self-Play Reinforcement Learning
arXiv:2605.16315v1 Ankündigung: neu Abstract: Wir zeigen, dass ein Schwellwert in der Entscheidungskapazität bestimmt, ob Self-Play-Reinforcement-Learning-Agenten unter asymmetrischen Regelperturbationen zusammenbrechen. Über Poker-Varianten, Matrix-Games, ein Würfelspiel und mehrere Learning-Algorithmen hinweg führt das Eliminieren aller