Nvidia entwickelt eine neue Generation von GPUs für die Verarbeitung von Millionen von Kontexten

watch 1m, 25s
views 2

15:52, 10.09.2025

Artikel Inhalt
arrow

  • Disaggregated-Inference-Architektur
  • Ein Durchbruch für Wirtschaft und Wissenschaft
  • Fokus auf Inferenz statt Training
  • Markteinführung

Nvidia hat den Grafikprozessor Rubin CPX vorgestellt, der speziell für Sprach- und multimodale Modelle entwickelt wurde, die riesige Datenmengen speichern und analysieren müssen. Der Chip ist für die Verarbeitung von Kontexten mit mehr als 1 Million Token optimiert – ein Wert, der die Möglichkeiten moderner Systeme bei weitem übersteigt.

Disaggregated-Inference-Architektur

Die wichtigste Innovation des Rubin CPX ist die Verwendung einer Disaggregated-Inference-Architektur. Bei diesem Ansatz verarbeiten mehrere GPUs verschiedene Teile einer Aufgabe und führen die Ergebnisse dann zu einer einzigen Antwort zusammen. Dies erhöht die Arbeitsgeschwindigkeit, reduziert Verzögerungen und macht die Ressourcennutzung effizienter. Dies ist besonders nützlich für die Analyse von Dokumenten, die Erstellung von Multimedia-Inhalten und die Arbeit mit großen Code-Projekten.

Ein Durchbruch für Wirtschaft und Wissenschaft

Nvidia betont, dass Rubin CPX neue Horizonte für Juristen, Mediziner und Entwickler eröffnet. Im Rechtswesen hilft es bei der Arbeit mit Hunderten von Seiten von Gesetzen, in der Medizin beim Abgleich großer Patientendatenmengen und in der IT bei der Analyse ganzer Projekte anstelle einzelner Dateien. Im kreativen Bereich ermöglicht die GPU die Erstellung langer Videos und komplexer Multimedia-Projekte.

Fokus auf Inferenz statt Training

Im Gegensatz zu herkömmlichen Lösungen zielt Rubin CPX in erster Linie auf die Optimierung der Inferenz ab – die Beschleunigung der Arbeit bereits fertiger Modelle. Dies macht es attraktiv für Unternehmen, denen es wichtig ist, KI schneller und kostengünstiger in ihr Geschäft zu integrieren.

Markteinführung

Die Markteinführung von Rubin CPX wird für Ende 2026 erwartet. Experten gehen davon aus, dass genau dieser Prozessor einen neuen Standard für die Branche setzen könnte, in der die Arbeit mit langem Kontext keine Seltenheit mehr sein wird, sondern zur Norm wird.

Teilen

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Weitere Artikel zu diesem Thema

cookie

Cookies und Datenschutz akzeptieren?

Wir verwenden Cookies, um sicherzustellen, dass wir Ihnen die beste Erfahrung auf unserer Website bieten. Wenn Sie fortfahren, ohne Ihre Einstellungen zu ändern, gehen wir davon aus, dass Sie mit dem Empfang aller Cookies auf der HostZealot-Website einverstanden sind.