PROWL: Priorisierte Regret-getriebene Optimierung für World Model Learning

arXiv:2605.18803v1 Ankündigungstyp: neu Abstract: Moderne aktions-konditionierte Video-World-Modelle erreichen starken kurzfristigen visuellen Realismus, bleiben aber unzuverlässig bei seltenen, interaktions-kritischen Transitions, die nachgelagerte Planung und Policy-Performance dominieren. Da passive Demonstrationsdaten systematisch