News Radar

Datensatz-Nutzungs-Inferenz ohne Shadow Models oder zurückgehaltene Daten

arXiv:2606.26257v1 Ankündigungstyp: neu Abstract: Wie viel meiner Daten wurden zum Trainieren eines Machine-Learning-Modells verwendet? Dataset Usage Inference (DUI) zielt darauf ab, dies zu …

Erkennung und Kontrolle von Opportunismus mit kaskadierenden linearen Merkmalen

arXiv:2606.26155v1 Ankündigungstyp: neu Abstract: Die Interpretation und Kontrolle von Modellverhalten durch Activation-Steering-Methoden erfordert viele Paare kontrastierender Stichproben, die …

Fast LeWorldModel

arXiv:2606.26217v1 Ankündigungstyp: neu Abstract: Joint-Embedding Predictive Architectures (JEPAs), einschliesslich des kürzlichen LeWorldModel (LeWM), haben sich zu einer vielversprechenden …

KG-TRACE: Ein neuro-symbolisches Framework für mechanistische Verankerung in der Vorhersage von Antibiotikaresistenzen

arXiv:2606.26179v1 Ankündigungstyp: neu Abstract: Während WGS-basierte AMR-Vorhersage hohe Genauigkeit erreicht hat, fehlt bestehenden Modellen ein Mechanismus, um neuronale Attributionen in …

Wissensaugmentierte Agentic AI für die Suche nach Medikamenteninformationen im Bereich psychische Gesundheit

arXiv:2606.26205v1 Ankündigungstyp: neu Abstract: Patienten suchen zunehmend online nach Medikamenteninformationen, doch Sicherheitswissen für psychiatrische Medikamente ist zwischen regulatorischen …

Das Leben nach Benchmark-Sättigung: Eine Fallstudie zu CORE-Bench

arXiv:2606.26158v1 Ankündigungstyp: neu Abstract: Wenn die Genauigkeit eines Benchmarks gesättigt ist, wird dieser oft zurückgezogen und durch eine anspruchsvollere Version ersetzt. Wir zeigen, dass …

Notwendig aber nicht ausreichend: Temperaturkontrolle und Reproduzierbarkeit in LLM-as-Judge-Sicherheitsbewertungen

arXiv:2606.26185v1 Ankündigungstyp: neu Abstract: LLM-as-Judge-Komponenten sind nun Standard in Evaluierungs-Umgebungen, einschliesslich Sicherheitsbewertungen, bei denen ein …

Neural Architecture Search für Generative Adversarial Networks: Eine umfassende Übersicht und kritische Analyse

arXiv:2606.26169v1 Ankündigungstyp: neu Abstract: Neural Architecture Search (NAS) hat sich als zentrale Technik zur Optimierung des Designs von Generative Adversarial Networks (GANs) etabliert und …

Ablehnung tritt downstream von Persona in Chat-Modellen auf

arXiv:2606.26161v1 Ankündigungstyp: neu Abstract: Lineare Richtungen im Aktivierungsraum wurden sowohl für Ablehnungs- als auch für Persona-Merkmale in instruction-tuned Chat-Modellen identifiziert, …

Starten Sie einen vLLM-Server auf HF Jobs in einem Befehl

Statistische und strukturelle Ansätze zur algorithmischen Fairness

arXiv:2606.26200v1 Ankündigungstyp: neu Abstract: Moderne Machine-Learning-Systeme sind über ihre Ursprünge als isolierte prädiktive Konstrukte hinauswachsen und haben sich zu komplexen …

Topologie-informierte neuronale Netze zur Hochwassererkennung in optischen und Synthetic-Aperture-Radar-Bildern

arXiv:2606.26204v1 Ankündigungstyp: neu Abstract: Hochwasser beeinträchtigen häufig Regionen auf der ganzen Welt. Eine schnelle und genaue Hochwassererkennung ist entscheidend für die Notfallreaktion …

Ein Spektral-Phasendiagramm für binäre Few-Shot-Klassifikation: Intrinsische Dimensionalität, geometrische Sättigung und Darstellungsdiagnose

arXiv:2606.24903v1 Ankündigung: Neue Arbeit. Abstrakt: Die Entscheidung, wann die Erfassung beschrifteter Beispiele beendet werden sollte, ist ein grundlegendes, aber untertheoriesiertes Problem im …

Konforme Orbit-gültige Vertrauenshorizonte für äquivariante Weltmodelle

arXiv:2606.24946v1 Ankündigung: Neue Arbeit. Abstrakt: Gelernte Weltmodelle sind nur über Horizonte nützlich, in denen ihr Rollout-Fehler kontrolliert bleibt. Wir untersuchen die …

Dense Supervision ist nicht ausreichend: Der Readout-Blindfleck in Schleifen-Language-Modellen

arXiv:2606.24898v1 Ankündigung: Neue Arbeit. Abstrakt: Schleifen-Language-Modelle wandeln verborgene Zustände in Laufzeit-Zustände um: jeder Zustand wird für Vorhersagen dekodiert und zurück in …

Digital-Twin-gesteuerte adaptive Sim-zu-Real-Ausrichtung durch Reinforcement Learning für vibrationsbasierte Lagergesundheitsüberwachung unter Datenmangel

arXiv:2606.24954v1 Ankündigung: Neue Arbeit. Abstrakt: Vibrationsbasierte Gesundheitsüberwachung rotierender Maschinen erfordert zuverlässige Fehlererkennung unter Betriebsdatenbeschränkungen, doch …

Von der Meta-Idee zur fortgeschrittenen mathematischen Entdeckung – gemeinsame Human-AI-Entdeckung von Sign-Embedding-Quantenalgorithmen

arXiv:2606.24899v1 Ankündigung: Neue Arbeit. Abstrakt: AI-gestützte Mathematik wird oft anhand der Lösung vordefinierter Probleme bewertet. In der Praxis beginnen jedoch viele wichtige Fortschritte …

Holografisches Gedächtnis für Zero-Shot-Kompositionsreasoning in Knowledge Graphs: Eine mechanistische Studie über Ausfallstellen und Gründe

arXiv:2606.24948v1 Ankündigung: Neue Arbeit. Abstrakt: Knowledge-Graph-Embedding-(KGE-)Modelle sagen Single-Hop-Links gut voraus, haben aber keinen Mechanismus für Zero-Shot-Kompositionsabfragen: …

Wie Komplexität zur Lernopazität im Machine Learning beiträgt

arXiv:2606.24953v1 Ankündigung: Neue Arbeit. Abstrakt: Machine-Learning-(ML-)Algorithmen sind bekannt für ihre Opazität. Wir kennen die Gründe für ihre Vorhersagen nicht. Der Lernprozess, der zur …

LLM-Evolution als industrielles Ökosystem im Maßstab: Eine Lebenszyklusperspektive auf kontinuierliches Lernen

arXiv:2606.24901v1 Ankündigung: Neue Arbeit. Abstrakt: Kontinuierliche Lernfähigkeit ist entscheidend für industrielle LLMs, da bereitgestellte Modelle kontinuierlich aktualisiert werden müssen, um …