Verallgemeinerungsgarantien bei datengestützter Abstimmung des Gradient Descent mit Langevin-Updates

arXiv:2604.13130v1 Wir untersuchen Learning to Learn für Regressionsprobleme durch die Linse der Hyperparameter-Abstimmung. Wir schlagen den Langevin Gradient Descent Algorithm (LGD) vor, der den Mittelwert der durch die Verlustfunktion und Regularisierung definierten Posterior-Verteilung approximiert.