Red Hat führt llm-d ein, eine Kubernetes-basierte Plattform für skalierbare KI-Inferenz

watch 1m
views 2

15:15, 22.05.2025

Artikel Inhalt
arrow

  • Die wichtigsten Funktionen von llm-d
  • Zusammenarbeit mit führenden Akteuren der KI-Branche
  • Technologie und Architektur

Red Hat hat llm-d vorgestellt, ein neues Open-Source-Projekt, das für die hochperformante verteilte Inferenz von großen Sprachmodellen (LLMs) entwickelt wurde. Die Plattform wird auf Basis von Kubernetes entwickelt und konzentriert sich auf die Vereinfachung der Skalierung von generativer KI. Der Quellcode ist auf GitHub unter der Apache 2.0 Lizenz verfügbar.

Die wichtigsten Funktionen von llm-d

Zu den Hauptmerkmalen der Plattform gehören

  • Optimierter Inferenz-Scheduler für vLLM;
  • Disaggregierte Service-Architektur;
  • Wiederverwendung von Präfix-Caches;
  • Flexible Skalierung je nach Datenverkehr, Aufgaben und verfügbaren Ressourcen.

Zusammenarbeit mit führenden Akteuren der KI-Branche

Die Entwicklung wird in Partnerschaft mit Unternehmen wie Nvidia, AMD, Intel, IBM Research, Google Cloud, CoreWeave, Hugging Face und anderen durchgeführt. Eine solche Zusammenarbeit unterstreicht die Ernsthaftigkeit des Ansatzes von llm-d und das Potenzial der Plattform als Industriestandard.

Technologie und Architektur

Das Projekt nutzt die vLLM-Bibliothek für verteilte Inferenz sowie Komponenten wie LMCache für KV-Cache-Offloading, KI-gestütztes intelligentes Traffic-Routing, hocheffiziente Kommunikations-APIs und automatische Skalierung auf Last und Infrastruktur.

All dies ermöglicht es Ihnen, das System an unterschiedliche Nutzungsszenarien und Leistungsanforderungen anzupassen. Die Markteinführung von llm-d kann ein wichtiger Schritt sein, um leistungsstarke KI-Systeme zu demokratisieren und sie einem breiten Publikum von Entwicklern und Forschern zugänglich zu machen.

Teilen

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

-9.9%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
40 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 1024 Linux

4.93 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
3 Xeon Cores
RAM
RAM
1 GB
Space
Space
20 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 1024 Linux

6.6 /mo

/mo

Alle 12 Monate abgerechnet

-5.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 2048 Windows

11.54 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
16 GB
Space
Space
150 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 16384
OS
CentOS
Software
Software
Keitaro

55.54 /mo

/mo

Alle 12 Monate abgerechnet

-9.7%

CPU
CPU
10 Xeon Cores
RAM
RAM
64 GB
Space
Space
300 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 65536 Windows

138.99 /mo

/mo

Alle 12 Monate abgerechnet

-21.5%

CPU
CPU
2 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 4096 HK Windows

40 /mo

/mo

Alle 12 Monate abgerechnet

-21%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
8 TB
wKVM-SSD 8192 Metered Windows

65 /mo

/mo

Alle 12 Monate abgerechnet

-20.6%

CPU
CPU
6 Xeon Cores
RAM
RAM
8GB
Space
Space
100GB SSD
Bandwidth
Bandwidth
500GB
KVM-SSD 8192 HK Linux

59 /mo

/mo

Alle 12 Monate abgerechnet

-15.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-wKVM 2048 Windows

54 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 8192 Linux

115.5 /mo

/mo

Alle 12 Monate abgerechnet

Weitere Artikel zu diesem Thema

cookie

Cookies und Datenschutz akzeptieren?

Wir verwenden Cookies, um sicherzustellen, dass wir Ihnen die beste Erfahrung auf unserer Website bieten. Wenn Sie fortfahren, ohne Ihre Einstellungen zu ändern, gehen wir davon aus, dass Sie mit dem Empfang aller Cookies auf der HostZealot-Website einverstanden sind.