News Radar

Die Wiola-Architektur für effiziente Small Language Models

Wir präsentieren Wiola, eine vollständig originale Small-Language-Model-Architektur (SLM), die von Grund auf entwickelt wurde und keine strukturelle Verbindung zu bestehenden Modellreihen wie GPT, …

Wann sollten Service-Agenten überdenken? Schwierigkeitsbasierte Steuerung in Customer-Service-Operationen

Autonome Customer-Service-Agenten verlagern sich von Konversationsschnittstellen zu operativen Ausführungsrollen: Sie rufen Firmendaten ab, wenden Service-Richtlinien an und führen …

Ein Contextual-Bandit Oversight Game mit zweiseitiger Informationsasymmetrie

arXiv:2607.00155v1 Ankündigung: Neue Arbeit Abstract: Wir untersuchen die Runtime-Überwachung durch Menschen eines AI-Agenten, wenn private Informationen in beide Richtungen fließen: der Mensch kennt …

Begrenzte Moralität: Definition des Raums der moralischen Berechnung

arXiv:2607.00002v1 Ankündigung: Neue Arbeit Abstract: Moralische Kognition wurde traditionell als Einhaltung fester ethischer Theorien modelliert – Deontologie, Konsequentialismus, Tugendethik – …

Konstruktive Alignment: Steuerung von Präferenz-Dynamiken in Mensch-AI-Interaktion

arXiv:2607.00001v1 Ankündigung: Neue Arbeit Abstract: Die meisten Ansätze zur AI-Alignment behandeln menschliche Präferenzen als feste Ziele, die abgeleitet und optimiert werden müssen. Diese Annahme …

EVOTS: Evolutionäre Transformer-Suche für Zeitreihen-Prognosen

arXiv:2607.00154v1 Ankündigung: Neue Arbeit Abstract: Evolutionäres Neural Architecture Design für multivariate Zeitreihen-Prognosen bleibt untererforscht, mit den meisten Ansätzen, die auf feste …

FRAME: Lernen der Adaptationsdomäne mit einer Mischung von Fractional-Fourier Experts

arXiv:2607.00162v1 Ankündigung: Neue Arbeit Abstract: Parameter-effizientes Fine-Tuning (PEFT) reparametrisiert Gewichtsupdates in einer festen Basis: Low-Rank-Adapter operieren im räumlichen …

GRPO, Dr. GRPO und DAPO sind drei Operationen auf einer Zahl: Die Gruppen-Standardabweichungs-Identität

arXiv:2607.00152v1 Ankündigung: Neue Arbeit Abstract: Drei der beliebtesten Methoden zum Training von Language Models zum Reasoning sehen wie drei verschiedene Tricks aus. Das sind sie nicht. Alle …

Fehler sicher machen: Ein eingeschränktes, verifizierbares Agent-Framework für Open-Web-Datenerfassung

arXiv:2607.00035v1 Ankündigung: Neue Arbeit Abstract: LLMs und Agenten können Web-Scraper aus natürlichsprachlichen Anforderungen generieren, doch die direkte Generierung bleibt unzuverlässig …

RareDxR1: Autonomes medizinisches Reasoning für seltene Krankheitsdiagnosen jenseits menschlicher Annotation

arXiv:2607.00147v1 Ankündigung: Neue Arbeit Abstract: Die Differentialdiagnose seltener Krankheiten ist eine kritische und mühsame klinische Aufgabe, die von Ärzten verlangt, präzise Phänotypen aus …

Repräsentation als Engpass für mechanistische Interpretierbarkeit: Das Manifestation Unit Protocol

arXiv:2607.00089v1 Ankündigung: Neue Arbeit Abstract: Mechanistische Interpretierbarkeit hat einen umfangreichen Bestand an Analyse auf Komponentenebene hervorgebracht, die charakterisiert, was …

Skalierung von thermodynamischen AI-Modellen

arXiv:2607.00170v1 Ankündigung: Neue Arbeit Abstract: Thermodynamische Computing-Geräte basierend auf dem Ising-Modell zeigen großes Potential für stromsparende AI-Inferenz und Edge Computing, doch …

SemiScope: Entwirren von Klassifikator-Tuning und gemeinsamer Optimierung bei semi-überwachter Sicherheitsklassifikation

arXiv:2607.00113v1 Ankündigung: Neue Arbeit Abstract: Hintergrund. Gekennzeichnete Daten für Sicherheitsklassifikation sind knapp. Semi-überwachtes Lernen (SSL) propagiert Labels von einem kleinen …

TallyTrain: Kommunikationseffiziente Federated Distillation

arXiv:2607.00173v1 Ankündigung: Neue Arbeit Abstract: Federated Learning ist bandbreitenbegrenzt auf zwei orthogonale Achsen: Modellgröße, die einschränkt, wie oft Parameter-Averaging-Methoden sich …

Verifizierbare Belohnungen für kalibrierte probabilistische Prognosen

arXiv:2607.00164v1 Ankündigung: Neue Arbeit Abstract: Reinforcement Learning mit verifizierbaren Belohnungen kann grundsätzlich kalibrierte probabilistische Prognose-Systeme trainieren, da eine …

Accelerometry-Derived Digital Biomarkers for Cardiometabolic Risk: A Population-Representative Tabular Benchmark with Uncertainty Quantification

arXiv:2606.30702v1 Announce Type: new Abstract: Structured tabular data dominates clinical medicine, yet existing benchmarks fail to reflect real-world properties like complex survey sampling, …

BayesBench: Evaluating LLM Belief Trajectories Under Multi-Turn Evidence Accumulation

arXiv:2606.30850v1 Announce Type: new Abstract: Large language models (LLMs) are typically deployed in multi-turn conversations, where each turn provides new evidence that should reduce epistemic …

Contrastive Reflection for Iterative Prompt Optimization

arXiv:2606.30840v1 Announce Type: new Abstract: LLM agents are becoming central to information retrieval: they issue retrieval queries, synthesize answers, and increasingly serve as judges for IR …

From Search to Synthesis: Training LLMs as Zero-Shot Workflow Generators

arXiv:2606.30704v1 Announce Type: new Abstract: Large language models (LLMs) excel across a wide range of tasks, yet their instance-specific solutions often lack the structural consistency needed for …

Gradient Smoothing: Coupling Layer-wise Updates for Improved Optimization

arXiv:2606.30813v1 Announce Type: new Abstract: Deep neural networks with repeated architectural blocks, such as transformers, often exhibit structured relationships across layers that emerge during …