Ergebnisse der Benchmarks für Grok 4.1 Fast und Details zur Agent Tools API
16:19, 24.11.2025
Das xAI-Team hat die Ergebnisse der Benchmarks veröffentlicht, bei denen Grok 4.1 Fast sich als führend unter seinen Mitbewerbern herausgestellt hat. Darüber hinaus haben die Entwickler detaillierte Informationen zur Infrastruktur der Agent Tools API bekannt gegeben.
Grok 4.1 Fast nimmt eine führende Position ein
Basierend auf den aktualisierten Benchmark-Informationen von xAI nimmt Grok 4.1 Fast in den folgenden Kategorien eine führende Position ein:
- τ²-bench Telecom: In dieser Kategorie erzielt das neue Modell das maximal mögliche Ergebnis von 100 % und liegt damit deutlich vor Claude Sonnet 4.5, GPT-5.1 und Grok 4.
- Berkeley Function Calling v4: Das neue Modell erzielt 72 % in der Kategorie Genauigkeit bei niedrigen Kosten und wird damit ebenfalls zum Spitzenreiter.
- Langer Kontext: Das Modell behält eine stabile Qualität bis zu einem Kontextfenster von 2 Millionen Zeichen bei. In dieser Kategorie erzielt das neue Modell beispielsweise ein Ergebnis von 67 %, während Grok 4 nur 22 % erreicht.
Agent Tools API – Tools für autonome Agenten
Die Agent Tools API ist eine Reihe von Server-Tools, die Zugriff auf externe Operationen und Echtzeitdaten bieten.
Mit Hilfe der API kann ein Agent:
- Mehrere Tools in einer Kette automatisch kombinieren.
- Eine intelligente Suche in einem hochgeladenen Dokument durchführen.
- Eine Verbindung zu externen MCP-Servern herstellen.
- Daten in X in Echtzeit suchen.
- Python-Code in einer sicheren Umgebung ausführen.
Das Besondere an diesen Tools ist, dass sie vollständig auf der xAI-Infrastruktur laufen. So musst du dich nicht um Umgebungen, Schlüssel oder Limits kümmern, denn Grok entscheidet selbst, welche Schritte nötig sind, und ruft das passende Tool auf. Es können auch parallele Aufrufe gemacht werden.
Derzeit stehen zwei Modellvarianten zur Verfügung: „Reasoning” für Aufgaben mit tiefgreifenden Überlegungen und „Non-Reasoning” für sofortige Antworten. Das Tool „Agent Tools API” ist für xAI-Benutzer kostenlos zugänglich, und das Modell ist bis zum 3. Dezember kostenlos.