MixAtlas: Unsicherheits-bewusste Daten-Mischungs-Optimierung für multimodales LLM-Midtraining
arXiv:2604.14198v1 Domain-Reweighting kann die Stichprobeneffizienz und generalisierte Downstream-Leistung verbessern, doch Daten-Mischungs-Optimierung für multimodales Midtraining bleibt weitgehend unerforcht. Aktuelle multimodale Trainingsansätze optimieren Mischungen entlang einer einzelnen Dimension.