Nvidia entwickelt eine neue Generation von GPUs für die Verarbeitung von Millionen von Kontexten
15:52, 10.09.2025
Nvidia hat den Grafikprozessor Rubin CPX vorgestellt, der speziell für Sprach- und multimodale Modelle entwickelt wurde, die riesige Datenmengen speichern und analysieren müssen. Der Chip ist für die Verarbeitung von Kontexten mit mehr als 1 Million Token optimiert – ein Wert, der die Möglichkeiten moderner Systeme bei weitem übersteigt.
Disaggregated-Inference-Architektur
Die wichtigste Innovation des Rubin CPX ist die Verwendung einer Disaggregated-Inference-Architektur. Bei diesem Ansatz verarbeiten mehrere GPUs verschiedene Teile einer Aufgabe und führen die Ergebnisse dann zu einer einzigen Antwort zusammen. Dies erhöht die Arbeitsgeschwindigkeit, reduziert Verzögerungen und macht die Ressourcennutzung effizienter. Dies ist besonders nützlich für die Analyse von Dokumenten, die Erstellung von Multimedia-Inhalten und die Arbeit mit großen Code-Projekten.
Ein Durchbruch für Wirtschaft und Wissenschaft
Nvidia betont, dass Rubin CPX neue Horizonte für Juristen, Mediziner und Entwickler eröffnet. Im Rechtswesen hilft es bei der Arbeit mit Hunderten von Seiten von Gesetzen, in der Medizin beim Abgleich großer Patientendatenmengen und in der IT bei der Analyse ganzer Projekte anstelle einzelner Dateien. Im kreativen Bereich ermöglicht die GPU die Erstellung langer Videos und komplexer Multimedia-Projekte.
Fokus auf Inferenz statt Training
Im Gegensatz zu herkömmlichen Lösungen zielt Rubin CPX in erster Linie auf die Optimierung der Inferenz ab – die Beschleunigung der Arbeit bereits fertiger Modelle. Dies macht es attraktiv für Unternehmen, denen es wichtig ist, KI schneller und kostengünstiger in ihr Geschäft zu integrieren.
Markteinführung
Die Markteinführung von Rubin CPX wird für Ende 2026 erwartet. Experten gehen davon aus, dass genau dieser Prozessor einen neuen Standard für die Branche setzen könnte, in der die Arbeit mit langem Kontext keine Seltenheit mehr sein wird, sondern zur Norm wird.