Universal Transformers benötigen Memory: Tiefe-Status-Tradeoffs im adaptiven rekursiven Reasoning
arXiv:2604.21999v1 Announcement Type: neu Abstract: Wir untersuchen gelernte Memory-Token als rechnerisches Notizbuch für einen Single-Block Universal Transformer (UT) mit Adaptive Computation Time (ACT) auf Sudoku-Extreme, einem kombinatorischen Reasoning-Benchmark. Wir stellen fest, dass Memory-Token empirisch notwendig sind: