Alibaba Cloud reduziert GPU-Auslastung für KI-Dienste um fast das Fünffache
14:43, 22.10.2025
Alibaba Cloud kam zu dem Schluss, dass KI-Dienste Ressourcen oft irrational nutzen. Viele KI-Modelle verbrauchen Leistung ungleichmäßig und erhöhen dadurch die Belastung der GPU. Genau diese ineffiziente Ressourcenverteilung behindert die Skalierung und erhöht die Kosten, die mit der KI-Infrastruktur verbunden sind.
Aegaeon: Ressourcen-Umverteilung
Als Reaktion auf die festgestellte Herausforderung stellte Alibaba Cloud das System Aegaeon vor, das Ressourcen dynamisch umverteilt und dadurch das Problem löst. Dank des Systems können Grafikmodule nun in Echtzeit zwischen Modellen umschalten, sogar während der Antwortgenerierung.
Warum Aegaeon vorteilhaft ist
Das neue System ermöglicht es einer einzigen GPU, bis zu sieben Modelle gleichzeitig zu bedienen, was deutlich produktiver ist als die früheren zwei bis drei Modelle. Bei der Nutzung von Aegaeon wurden die Verzögerungen beim Umschalten zwischen Aufgaben um 97 % reduziert. Das System wird bereits auf dem Bailian-Marktplatz von Alibaba Cloud eingesetzt. Dies stellt einen wichtigen Schritt auf dem Weg zu einer kostengünstigeren und nachhaltigeren KI-Infrastruktur dar.