Ein echter Konkurrent für Nvidia und ein Chip statt Tausender Server
12:34, 09.12.2025
Das Unternehmen Cerebras Systems hat die Wafer Scale Engine entwickelt – den größten Prozessor in der Größe eines Esstellers. Diese technische Innovation wurde mit dem Ziel entwickelt, die Übertragungszeiten zwischen Servern zu minimieren. Das neue System besteht aus einem Monolithen, in dem Rechenleistung und Speicher gleichzeitig vereint sind.
Geopolitische Beschränkungen
Ende dieses Jahres sah sich Cerebras Systems statt des offensichtlichen Erfolgs im Halbleitersektor mit echten Problemen bei der öffentlichen Platzierung konfrontiert. Bereits im Oktober schloss das Unternehmen eine private Finanzierungsrunde in Höhe von 1,1 Milliarden Dollar ab.
Cerebras zeigte fantastische Ergebnisse, erzielte einen Umsatz von 500 Millionen Dollar und gewann Meta, AWS und IBM als Kunden. Die Situation änderte sich jedoch schlagartig, als der Ausschuss für Auslandsinvestitionen der USA den Börsengang des Unternehmens wegen möglicher Technologieabflüsse nach China blockierte.
Mehr als 80 Prozent der Einnahmen des Unternehmens werden von der Holding G42 aus Abu Dhabi generiert. Diese Partnerschaft wird aufgrund des Umfangs der Zusammenarbeit der Unternehmen und der Herkunft des Kapitals als strategische Bedrohung angesehen.
So wurde das Unternehmen mit Lösungen, die Nvidia deutlich übertreffen, zum Spielball der politischen Lage.
Besonderheiten des Flaggschiff-Chips Cerebras WSE-3
Cerebras WSE-3 ist eine Platte, die als einziger Superprozessor fungiert. Die Architektur von Nvidia besteht hingegen aus riesigen Clustern. Außerdem verwendet Nvidia Blackwell den HBM-Speicherstandard, der sich nicht im Rechenchip selbst, sondern daneben befindet. Dieser Ansatz führt zu Verzögerungen beim Zugriff auf Daten.
Cerebras hat diesen Ansatz komplett geändert und den gesamten Speicher in die Chipstruktur (SRAM) integriert. Dadurch minimiert das Unternehmen nicht nur die Latenz, sondern vermeidet auch einen Mangel an HBM-Speicher, da Nvidia die Lieferung von HBM praktisch monopolisiert hat.
Der ultraschnelle SRAM-Speicher ist in die Rechenkerne integriert und bietet eine Bandbreite von 21 Petabyte pro Sekunde – das sind phänomenale Werte im Vergleich zu den Top-Lösungen von Nvidia.
Skalierung zur Erreichung moderner Leistungsfähigkeit
Moderne LLMs arbeiten auf Grafikkarten-Clustern, um das erwartete Ergebnis zu erzielen. Nvidia hat viel Zeit und Ressourcen aufgewendet, um den NVLink-Bus zu entwickeln und den synchronen Betrieb von Tausenden von Chips sicherzustellen. Dennoch verbrauchen Cluster mehr Energie für die Übertragung von Ergebnissen und die Synchronisation.
WSE-3 hat dieses Problem nicht, da 900.000 Kerne auf einem einzigen Siliziumchip untergebracht werden können. Der neue Ansatz kommt ohne optische Transceiver, Netzwerkkabel und Switches aus, sodass interne Verzögerungen auf Null reduziert werden.