Jenseits von Single-Model-Optimierung: Bewahrung von Plastizität beim kontinuierlichen Reinforcement Learning
arXiv:2604.15414v1 Ankündigungstyp: neu Abstract: Kontinuierliches Reinforcement Learning muss Retention mit Adaptation ausbalancieren, doch viele Methoden verlassen sich immer noch auf Single-Model-Preservation, indem sie sich auf eine sich entwickelnde Policy als Hauptlösung zur Wiederverwendung über Tasks hinweg festlegen. Auch wenn eine zuvor erfolgreiche Policy…