News Radar

ARBITER: Reasoning-Trajektorienbecken und Mehrheitsvotum-Ausfälle bei Test-Zeit-Sampling

arXiv:2605.26172v1 Ankündigungstyp: neu Abstract: Wenn Sprachmodelle Test-Zeit-Sampling verwenden, generieren sie mehrere Reasoning-Trajektorien und wählen eine Antwort durch Mehrheitsvotum. Wir …

GAC: Rausch-bewusstes adaptives Mischen für hybrids SFT-RL Post-Training

arXiv:2605.26184v1 Ankündigungstyp: neu Abstract: Hybrids Post-Training kombiniert üblicherweise überwachtes Fine-Tuning und Reinforcement Learning, aber feste Mischungspläne können sich nicht …

GEM: Geometrisches Entropie-Mischen für optimale LLM-Datenkuration

arXiv:2605.26121v1 Ankündigungstyp: neu Abstract: Die Effizienz des LLM-Vortrainings hängt zunehmend von der Datenzusammensetzung ab, nicht vom reinen Volumen. Das optimale Mischen wird jedoch durch …

HRVConformer: Klassifizierung von neonataler hypoxisch-ischämischer Enzephalopathie aus Herzfrequenzsignalen

arXiv:2605.26190v1 Ankündigungstyp: neu Abstract: Dieses Paper präsentiert HRVConformer, eine neuartige Deep-Learning-Architektur zur Klassifizierung von hypoxisch-ischämischer Enzephalopathie (HIE) …

InfoQuant: Gestaltung von Aktivierungsverteilungen für Low-Bit-LLM-Quantisierung

arXiv:2605.26175v1 Ankündigungstyp: neu Abstract: Low-Bit-Aktivierungsquantisierung bleibt ein großer Engpass in der effizienten Bereitstellung großer Sprachmodelle (LLM). Die Schwierigkeit besteht …

ITBench-AA: Frontier Models schneiden unter 50% bei erstem Benchmark für Agentic Enterprise IT-Aufgaben ab – von Artificial Analysis und IBM

Max-Window-Skalierungsschätzung für Near-Lossless HiF8 W8A8 Quantisierungsbewusstes Training

arXiv:2605.26189v1 Ankündigungstyp: neu Abstract: Quantisierungsbewusstes Training (QAT) mit Low-Bit-Gleitkommaformaten ermöglicht effiziente LLM-Bereitstellung, führt aber zu subtilen Ausfallmodi, …

Neural Bayesian Sequential Routing

arXiv:2605.26147v1 Ankündigungstyp: neu Abstract: Menschliches Entscheidungstreffen ist sequenziell und unsicherheitsbewusst, doch Standard-Neuronale Netze verlassen sich oft auf statische, dichte …

Über Push-basiertes asynchrones Föderiertes Lernen: Ein Bias-Korrektur-Aggregationsansatz

arXiv:2605.26162v1 Ankündigungstyp: neu Abstract: Asynchrones dezentralisiertes föderiertes Lernen (ADFL) eliminiert zentrale Koordination und globale Synchronisierung, was es für großmaßstäbliche …

Planung neuronaler Dynamiken mit Lie-Gruppen-Einbettung durch überwachtes projektives Manifold-Lernen

arXiv:2605.26167v1 Ankündigungstyp: neu Abstract: Wir stellen Lie-Gruppen-eingebettete dynamische neuronale Netze (LieEDNN) und entsprechende Lernalgorithmen basierend auf Gradientenabstieg und …

SilIF: Silhouetten-erweiterter Isolation Forest für unüberwachte Transaktionsbetrugserkennung

arXiv:2605.26135v1 Ankündigungstyp: neu Abstract: Unüberwachte Anomalieerkennung wird vielfach in der Transaktionsbetrugserkennung eingesetzt, wo Kennzeichnungen knapp sind. Isolation Forest (IF) ist …

Die Constraint-Tax: Messung von Gültigkeits-Korrektheitskompromissen bei strukturierten Ausgaben für kleine Sprachmodelle

arXiv:2605.26128v1 Ankündigungstyp: neu Abstract: Produktions-LLM-Systeme benötigen zunehmend maschinenlesbare Ausgaben: JSON-Objekte, typisierte Traces, Regex-beschränkte Felder und …

TSFMAudit: Datenverunreinigung-Audit in Zeitreihen-Foundation-Modellen für Vorhersagen

arXiv:2605.26161v1 Ankündigungstyp: neu Abstract: Zeitreihen-Foundation-Modelle (TSFMs) werden zunehmend auf großen Corpora vortrainiert, was Bedenken aufwirft, dass Evaluationsdatensätze während des …

Wenn Regelverletzungen selten sind: Chimera-Training für logische Anomalieerkennung

arXiv:2605.26171v1 Ankündigungstyp: neu Abstract: Viele praktische Anomalien sind nicht nur seltene Eingaben, sondern Verstöße gegen semantische Einschränkungen: Objekte treten strukturiert zusammen …

Annäherung an Machine Unlearning durch Manifold-Representation-Forgetting unter Anleitung von Self-Mode-Konnektivität

arXiv:2605.22871v1 Ankündigung Typ: neu Abstract: Machine Unlearning ist ein grundlegender Mechanismus, der das Recht auf Vergessenwerden durchsetzt. Bestehende Unlearning-Studien, die sich auf …

BOHM: Kostenlose hierarchische Attribution für Compound-AI-Systeme

arXiv:2605.22866v1 Ankündigung Typ: neu Abstract: Compound-AI-Systeme leiten Aufgaben durch Hierarchien spezialisierter Komponenten. Attribution wird von Shapley-basierten Methoden (SHAP) dominiert, …

Energy per Successful Goal: Zielbasierte Energiebilanzierung für Agentic-AI-Systeme

arXiv:2605.22883v1 Announce Type: new Abstract: Aktuelle AI-Energie-Benchmarks messen den Verbrauch auf der Granularität eines einzelnen Model-Aufrufs oder Trainings-Durchlaufs. Für klassische …

FuRA: Vollrang-Parameter-effizientes Fine-Tuning mit spektraler Vorkonditionierung

arXiv:2605.22869v1 Ankündigung Typ: neu Abstract: Sowohl vollständiges Fine-Tuning (Full FT) als auch Parameter-effiziente Fine-Tuning-Methoden wie LoRA führen Gewichtsaktualisierungen durch, ohne …

FusionSense: Dreistufiges Near-Sensor-Learning für adaptives Multimodal-Edge-Intelligence zur Laufzeit

arXiv:2605.22868v1 Ankündigung Typ: neu Abstract: Autonome Systeme und Smart-Industry-Deployments verteilen zunehmend Berechnung auf Near-Sensor-, Edge- und Cloud-Ressourcen, wo strenge Energie-, …

ImProver 2: Iterativ selbstverbessernde LMs für neurosymbolische Proof-Optimierung

arXiv:2605.22885v1 Announce Type: new Abstract: Formale Mathematik-Bibliotheken expandieren schnell und schaffen einen wachsenden Bedarf, verifizierte Beweise zu refaktorieren für Wartbarkeit und um …