Red Hat führt llm-d ein, eine Kubernetes-basierte Plattform für skalierbare KI-Inferenz

15:15, 22.05.2025

Artikel Inhalt

Die wichtigsten Funktionen von llm-d
Zusammenarbeit mit führenden Akteuren der KI-Branche
Technologie und Architektur

Red Hat hat llm-d vorgestellt, ein neues Open-Source-Projekt, das für die hochperformante verteilte Inferenz von großen Sprachmodellen (LLMs) entwickelt wurde. Die Plattform wird auf Basis von Kubernetes entwickelt und konzentriert sich auf die Vereinfachung der Skalierung von generativer KI. Der Quellcode ist auf GitHub unter der Apache 2.0 Lizenz verfügbar.

Die wichtigsten Funktionen von llm-d

Zu den Hauptmerkmalen der Plattform gehören

Optimierter Inferenz-Scheduler für vLLM;
Disaggregierte Service-Architektur;
Wiederverwendung von Präfix-Caches;
Flexible Skalierung je nach Datenverkehr, Aufgaben und verfügbaren Ressourcen.

Zusammenarbeit mit führenden Akteuren der KI-Branche

Die Entwicklung wird in Partnerschaft mit Unternehmen wie Nvidia, AMD, Intel, IBM Research, Google Cloud, CoreWeave, Hugging Face und anderen durchgeführt. Eine solche Zusammenarbeit unterstreicht die Ernsthaftigkeit des Ansatzes von llm-d und das Potenzial der Plattform als Industriestandard.

Technologie und Architektur

Das Projekt nutzt die vLLM-Bibliothek für verteilte Inferenz sowie Komponenten wie LMCache für KV-Cache-Offloading, KI-gestütztes intelligentes Traffic-Routing, hocheffiziente Kommunikations-APIs und automatische Skalierung auf Last und Infrastruktur.

All dies ermöglicht es Ihnen, das System an unterschiedliche Nutzungsszenarien und Leistungsanforderungen anzupassen. Die Markteinführung von llm-d kann ein wichtiger Schritt sein, um leistungsstarke KI-Systeme zu demokratisieren und sie einem breiten Publikum von Entwicklern und Forschern zugänglich zu machen.

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Alle Produkte ansehen

KVM-SSD 4096 Metered

-24.7%

€

/mo

€ 31 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

4 GB

Space

50 GB SSD

Bandwidth

4 TB
DDoS Protected SSD-wKVM 8192

-15%

€

/mo

€ 101 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

8 GB

Space

100 GB SSD

Bandwidth

80 Mbps
wKVM-NVMe 8192

-8.6%

€

/mo

€ 42.3 /mo

Alle 12 Monate abgerechnet

CPU

6 Epyc Cores

RAM

8 GB

Space

100 GB NVMe

Bandwidth

Unlimited
KVM-SSD 512 Metered

-15.6%

€

/mo

€ 5.33 /mo

Alle 12 Monate abgerechnet

CPU

2 Xeon Cores

RAM

512 MB

Space

10 GB SSD

Bandwidth

1 TB
wKVM-HDD HK 16384

-8.8%

€

/mo

€ 45.62 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

16 GB

Space

400 GB HDD

Bandwidth

300 Gb
DDoS Protected SSD-KVM 16384

-10.2%

€

/mo

€ 123 /mo

Alle 6 Monate abgerechnet

CPU

6 Xeon Cores

RAM

16 GB

Space

150 GB SSD

Bandwidth

100 Mbps
wKVM-SSD 8192

-8.1%

€

/mo

€ 31.9 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

8 GB

Space

100 GB SSD

Bandwidth

Unlimited
KVM-SSD 4096 HK

-22.2%

€

/mo

€ 33 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

4 GB

Space

50 GB SSD

Bandwidth

300 GB
KVM-HDD HK 4096

-9.9%

€

/mo

€ 12.07 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

4 GB

Space

100 GB HDD

Bandwidth

300 Gb
KVM-HDD HK 8192

-10%

€

/mo

€ 20.58 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

8 GB

Space

200 GB HDD

Bandwidth

300 Gb