Zu ressourceneffizienten LLMs: End-to-End-Energiebuchhaltung von Distillations-Pipelines

arXiv:2605.13981v1 Ankündigungstyp: neu Abstract: Der Anstieg bei der Bereitstellung großer Language Models hat einen Anstieg der GPU-Nachfrage und Datencenter-Skalierung getrieben und Bedenken bezüglich Stromverbrauch, Netzbelastung und der Auswirkungen moderner AI-Workloads hervorgerufen. Distillation wird oft als eine der effizientesten Methoden beworben…