$E^3$-Agent: Ein ausführbarer und entwickelnder Agent für das Ressourcenmanagement von Edge Generative Inference

arXiv:2605.27428v1 Ankündigungstyp: neu Abstract: Edge-Deployments von generativer Inference sehen sich zunehmend zwei praktischen Realitäten gegenüber: Die Pro-Gerät-Pro-Modell-Leistung ist zum Zeitpunkt des Deployments oft unbekannt und ist aufgrund von benutzergesteuerten semantischen Ereignissen, Hintergrundlast und Gerätewechsel nicht-stationär