Architektur-gesteuerte Verschiebung: auf dem Weg zu einem leichtgewichtigen Selector für die Erfassung von Logit-Verschiebungstrends
arXiv:2605.27469v1 Ankündigungstyp: neu Abstract: Continual Learning (CL) ist ein praktisches Paradigma zur Nutzung der Kraft von tiefen vortrainierten neuronalen Netzwerken, aber welches vortrainierte Modell hat eine bessere Fähigkeit, “Plastizität-Stabilität” auszugleichen und verdient ausgewählt zu werden? Die Logit-Verschiebung dient als natürlicher Proxy