Planen Sie, bevor Sie handeln: Inference-Time Optimierung für RL Trading Agents
arXiv:2605.12653v1 Ankündigungstyp: neu Abstract: Reinforcement Learning Agenten für Portfolio-Management werden typischerweise als statische Policys trainiert und eingesetzt, ohne Mechanismus zur Nutzung von Preisvorhersagen zur Inferenzzeit. Wir schlagen FPILOT (Financial Plugin Inference-time Learning) vor