News Radar
Internationale Tech- und KI-Nachrichten, automatisch kuratiert und ins Deutsche übersetzt. Automatische Übersetzung — der Originaltext ist über den Quellenlink verfügbar.
Internationale Tech- und KI-Nachrichten, automatisch kuratiert und ins Deutsche übersetzt. Automatische Übersetzung — der Originaltext ist über den Quellenlink verfügbar.
arXiv:2605.10983v1 Ankündigungstyp: neu Zusammenfassung: Reinforcement Learning (RL) hat außergewöhnliches Potenzial bei der Ausrichtung von Diffusionsmodellen auf nachgelagerte Aufgaben gezeigt, …
arXiv:2605.10974v1 Ankündigungstyp: neu Zusammenfassung: Die zertifizierte Verifizierung von Transformer-Attention erfordert das Begrenzen der Softmax-Funktion über Intervallbeschränkungen der …
arXiv:2605.10981v1 Ankündigungstyp: neu Zusammenfassung: Referenz-freie Preference Optimization hat sich als effiziente Alternative zu Reinforcement Learning from Human Feedback etabliert, wobei …
arXiv:2605.06681v1 Eine hierarchische Ensemble-Pipeline wird eingeführt, um Anomalieerkennung in multivariaten Telemetrie-Daten der European Space Agency (ESA) zu adressieren. Die Methode integriert …
arXiv:2605.06678v1 Nach dem United Nations Office for Disaster Risk Reduction (2025) stieg die durchschnittliche jährliche Kosten für Naturkatastrophen von 70-80 Milliarden USD zwischen 1970 und 2000 …
arXiv:2605.06679v1 Vision-Language Models (VLMs) werden häufig durch Objekt-Halluzinationen untergraben, die Inhalte generieren, die der visuellen Realität widersprechen, aufgrund einer übermäßigen …
Bausteine für Foundation Model Training und Inference auf AWS
arXiv:2605.06702v1 Large Language Models (LLMs) sind zur zentralen Grundlage moderner künstlicher Intelligenz geworden, doch ihr Lebenszyklus bleibt durch eine starre Trennung zwischen Training und …
arXiv:2605.06716v1 Large Language Model (LLM)-basierte Agenten haben künstliche Intelligenz grundlegend umgestaltet, indem sie externe Tools und Planning-Fähigkeiten integrieren. Während …
arXiv:2605.06671v1 Large Language Models (LLMs) haben starkes Potenzial für viele mathematische Probleme gezeigt. Allerdings ist ihre Performance bei Graph-Algorithmus-Aufgaben noch unbefriedigend, …
arXiv:2605.06696v1 Sammlungen von interagierenden AI-Agenten können Koalitionen bilden, die emergente Organisationen auf Gruppenebene schaffen, die kritisch für AI-Safety und Alignment sind. Jedoch …
arXiv:2605.06676v1 Long-Context Inference in Large Language Models (LLMs) ist durch das lineare Wachstum des Key-Value (KV) Cache Memory begrenzt. Bestehende KV-Cache-Kompressions-Paradigmen sind …
arXiv:2605.06672v1 Chain-of-Thought (CoT) Reasoning und Reasoning-abgestimmte Modelle wie DeepSeek-R1 werden häufig angenommen, oberflächliche heuristische Biases durch sorgfältiges Denken zu …
arXiv:2605.06680v1 Flow Matching generiert Daten durch Integration eines erlernten Velocity Fields, wobei die Anzahl der Integrationsschritte (NFE) direkt die Inferenz-Kosten bestimmt. Wir …
arXiv:2605.06675v1 Large Language Models speichern alle zuvor berechneten Key-Value (KV) Paare während der Generierung, und dieser KV-Cache wächst linear mit der Sequenzlänge, was ihn zu einem …
arXiv:2605.06690v1 Rekursive Reasoning-Systeme wechseln zwischen dem Erwerben neuer Evidenz und der Verfeinerung eines angesammelten Verständnisses. Zwei Designentscheidungen bleiben typischerweise …
arXiv:2605.06683v1 Transformer-basierte Large Language Models sind in gewisser Weise durch die quadratische Zeit- und Speicherkomplexität der Attention limitiert. Wir stellen den Toeplitz MLP Mixer …
MachinaCheck: Aufbau eines Multi-Agent-CNC-Fertigungssystems auf AMD MI300X
OncoAgent: Ein Dual-Tier Multi-Agent Framework für datenschutzgerechte onkologische klinische Entscheidungsunterstützung
arXiv:2605.05222v1 Ankündigungstyp: neu Abstract: Standard-Transformer-Architekturen wenden die gleiche Anzahl von Schichten auf jeden Token an, unabhängig von der kontextuellen Schwierigkeit. Wir …