14-05-2026
arXiv AI+ML
🔬 Forschung

Planen Sie, bevor Sie handeln: Inference-Time Optimierung für RL Trading Agents

arXiv:2605.12653v1 Ankündigungstyp: neu Abstract: Reinforcement Learning Agenten für Portfolio-Management werden typischerweise als statische Policys trainiert und eingesetzt, ohne Mechanismus zur Nutzung von Preisvorhersagen zur Inferenzzeit. Wir schlagen FPILOT (Financial Plugin Inference-time Learning) vor

Originalartikel lesen bei arXiv AI+ML →

#ki #forschung