Nvidia entwickelt eine neue Generation von GPUs für die Verarbeitung von Millionen von Kontexten

1m, 25s

15:52, 10.09.2025

Artikel Inhalt

Disaggregated-Inference-Architektur
Ein Durchbruch für Wirtschaft und Wissenschaft
Fokus auf Inferenz statt Training
Markteinführung

Nvidia hat den Grafikprozessor Rubin CPX vorgestellt, der speziell für Sprach- und multimodale Modelle entwickelt wurde, die riesige Datenmengen speichern und analysieren müssen. Der Chip ist für die Verarbeitung von Kontexten mit mehr als 1 Million Token optimiert – ein Wert, der die Möglichkeiten moderner Systeme bei weitem übersteigt.

Disaggregated-Inference-Architektur

Die wichtigste Innovation des Rubin CPX ist die Verwendung einer Disaggregated-Inference-Architektur. Bei diesem Ansatz verarbeiten mehrere GPUs verschiedene Teile einer Aufgabe und führen die Ergebnisse dann zu einer einzigen Antwort zusammen. Dies erhöht die Arbeitsgeschwindigkeit, reduziert Verzögerungen und macht die Ressourcennutzung effizienter. Dies ist besonders nützlich für die Analyse von Dokumenten, die Erstellung von Multimedia-Inhalten und die Arbeit mit großen Code-Projekten.

Ein Durchbruch für Wirtschaft und Wissenschaft

Nvidia betont, dass Rubin CPX neue Horizonte für Juristen, Mediziner und Entwickler eröffnet. Im Rechtswesen hilft es bei der Arbeit mit Hunderten von Seiten von Gesetzen, in der Medizin beim Abgleich großer Patientendatenmengen und in der IT bei der Analyse ganzer Projekte anstelle einzelner Dateien. Im kreativen Bereich ermöglicht die GPU die Erstellung langer Videos und komplexer Multimedia-Projekte.

Fokus auf Inferenz statt Training

Im Gegensatz zu herkömmlichen Lösungen zielt Rubin CPX in erster Linie auf die Optimierung der Inferenz ab – die Beschleunigung der Arbeit bereits fertiger Modelle. Dies macht es attraktiv für Unternehmen, denen es wichtig ist, KI schneller und kostengünstiger in ihr Geschäft zu integrieren.

Markteinführung

Die Markteinführung von Rubin CPX wird für Ende 2026 erwartet. Experten gehen davon aus, dass genau dieser Prozessor einen neuen Standard für die Branche setzen könnte, in der die Arbeit mit langem Kontext keine Seltenheit mehr sein wird, sondern zur Norm wird.

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Alle Produkte ansehen

wKVM-NVMe 65536

-9.7%

CPU

10 Epyc Cores

RAM

64 GB

Space

300 GB NVMe

Bandwidth

Unlimited

Windows

€ 139.49 /mo

€

/mo

Alle 12 Monate abgerechnet

wKVM-SSD 2048 Metered

-18.4%

CPU

4 Xeon Cores

RAM

2 GB

Space

75 GB SSD

Bandwidth

2 TB

Windows

€ 24 /mo

€

/mo

Alle 12 Monate abgerechnet

Keitaro KVM 16384

-10%

CPU

6 Epyc Cores

RAM

16 GB

Space

150 GB NVMe

Bandwidth

Unlimited

CentOS

Software

Keitaro

€ 55.54 /mo

€

/mo

Alle 12 Monate abgerechnet

wKVM-SSD 4096

-10%

CPU

4 Xeon Cores

RAM

4 GB

Space

100 GB SSD

Bandwidth

Unlimited

Windows

€ 18.65 /mo

€

/mo

Alle 12 Monate abgerechnet

DDoS Protected SSD-wKVM 2048

-15.3%

CPU

4 Xeon Cores

RAM

2 GB

Space

75 GB SSD

Bandwidth

40 Mbps

Windows

€ 54 /mo

€

/mo

Alle 12 Monate abgerechnet

10Ge-KVM-SSD 2048

-10%

CPU

4 Xeon Cores

RAM

2 GB

Space

30 GB SSD

Bandwidth

Unlimited

Linux

€ 30.3 /mo

€

/mo

Alle 12 Monate abgerechnet

wKVM-SSD 2048 HK

-21.5%

CPU

2 Xeon Cores

RAM

2 GB

Space

75 GB SSD

Bandwidth

300 GB

Windows

€ 26 /mo

€

/mo

Alle 12 Monate abgerechnet

KVM-SSD 1024 Metered

-26.7%

CPU

3 Xeon Cores

RAM

1 GB

Space

20 GB SSD

Bandwidth

1 TB

Linux

€ 10 /mo

€

/mo

Alle 12 Monate abgerechnet

KVM-SSD 4096 Metered

-24.7%

CPU

4 Xeon Cores

RAM

4 GB

Space

50 GB SSD

Bandwidth

4 TB

Linux

€ 31 /mo

€

/mo

Alle 12 Monate abgerechnet

DDoS Protected SSD-KVM 4096

-16.2%

CPU

4 Xeon Cores

RAM

4 GB

Space

50 GB SSD

Bandwidth

60 Mbps

Linux

€ 67 /mo

€

/mo

Alle 12 Monate abgerechnet

Nvidia entwickelt eine neue Generation von GPUs für die Verarbeitung von Millionen von Kontexten

Disaggregated-Inference-Architektur

Ein Durchbruch für Wirtschaft und Wissenschaft

Fokus auf Inferenz statt Training

Markteinführung

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Weitere Artikel zu diesem Thema