News Radar
Internationale Tech- und KI-Nachrichten, automatisch kuratiert und ins Deutsche übersetzt. Automatische Übersetzung — der Originaltext ist über den Quellenlink verfügbar.
Internationale Tech- und KI-Nachrichten, automatisch kuratiert und ins Deutsche übersetzt. Automatische Übersetzung — der Originaltext ist über den Quellenlink verfügbar.
OlmoEarth v1.1: Eine effizientere Modell-Familie
arXiv:2605.16341v1 Ankündigung: neu Abstract: Niedrig-rangige Gradient-Kompression reduziert Kommunikation im verteilten Training durch Darstellung von Updates mit Rang-$r$-Faktoren. Dion ist eine …
arXiv:2605.16325v1 Ankündigung: neu Abstract: Phasenübergangsphänomene im Deep Learning (Grokking, emergente Fähigkeiten und ontologische Reorganisation bei Kontextwechsel) wurden durch mehrere …
arXiv:2605.16339v1 Ankündigung: neu Abstract: Preference Learning in großen Language Models stützt sich auf Reward-Modelle als Stellvertreter für menschliches Urteilsvermögen. Jedoch zeigen diese …
arXiv:2605.16302v1 Ankündigung: neu Abstract: Reinforcement Learning für Multi-Step-Reasoning mit großen Language Models (LLMs) verlässt sich oft auf spärliche terminalbasierte Rewards, was zu …
arXiv:2605.16311v1 Ankündigung: neu Abstract: Verteiltes Training großer neuronaler Netze wird durch vollständige Gradient-Kommunikation und koordinatenweise Optimierer begrenzt, die die …
arXiv:2605.16259v1 Ankündigung: neu Abstract: Während die Echtzeit-Bildgenerierung mit Diffusion-Modellen auf NVIDIA GPUs rasant fortgeschritten ist, bleibt systematische Optimierungsforschung auf …
arXiv:2605.16312v1 Ankündigung: neu Abstract: Wir untersuchen adversarisches Action-Masking im Self-Play Reinforcement Learning: ein Angreifer entfernt selektiv legale Aktionen aus dem Action-Set …
arXiv:2605.15206v1 Ankündigungstyp: neu Zusammenfassung: Autonome Agenten, die von Large Language Models (LLMs) angetrieben werden, werden zunehmend eingesetzt, um komplexe, mehrstufige Aufgaben wie …
arXiv:2605.15218v1 Ankündigungstyp: neu Zusammenfassung: Large Language Models, die für MAPDL-Finite-Element-Simulation eingesetzt werden, sehen sich praktischen Zuverlässigkeitsproblemen gegenüber: …
arXiv:2605.15202v1 Ankündigungstyp: neu Zusammenfassung: Präsentationen sind ein primäres Medium für wissenschaftliche Kommunikation, doch die meisten AI-Foliengeneratoren optimieren das Artefakt …
arXiv:2605.15205v1 Ankündigungstyp: neu Zusammenfassung: Die Verbesserung der Theory of Mind (ToM)-Fähigkeit von Large Language Models (LLMs) ist entscheidend für effektive soziale Interaktionen …
arXiv:2605.15217v1 Ankündigungstyp: neu Zusammenfassung: Instruction-Tuned Language Models zeigen Verhaltensgerechtigkeitsgedanken in hochriskanten Entscheidungen, während sie voreingenommene …
Fine-Tuning von NVIDIA Cosmos Predict 2.5 mit LoRA/DoRA für Robot-Videogenerierung
arXiv:2605.15224v1 Ankündigungstyp: neu Zusammenfassung: LLM-basierte Agenten machen Fehler, doch Kritik kann oft dasselbe Modell zu korrektem Verhalten führen. Wenn Kritik jedoch entfernt wird, kann …
arXiv:2605.15227v1 Ankündigungstyp: neu Zusammenfassung: Self-Driving Laboratories (SDLs) haben zunehmend Aufmerksamkeit als Mittel zur Beschleunigung wissenschaftlicher Entdeckung erlangt; jedoch …
arXiv:2605.15219v1 Ankündigungstyp: neu Zusammenfassung: Können AI-Systeme echtes neues Wissen durch iterative Selbstverbesserung entdecken, und wenn ja, zu welchen Kosten? Wir präsentieren das …
PaddleOCR 3.5: OCR und Document-Parsing-Aufgaben mit Transformers-Backend ausführen
arXiv:2605.15208v1 Ankündigungstyp: neu Zusammenfassung: Large Language Models werden routinemäßig durch Post-Training-Quantisierung komprimiert, um Inferenzkosten und Speicherfußabdruck für Cloud- …
arXiv:2605.15204v1 Ankündigungstyp: neu Zusammenfassung: Multi-Agent-Orchestrierungsrahmen wie LangChain, LangGraph und CrewAI leiten Aufgaben durch graphenbasierte Pipelines, erzwingen aber nicht …