Veröffentlichung von ChatGPT Image 2.0: Eine neue Dimension der Textgenerierung auf Bildern
14:42, 22.04.2026
Vor kurzem hat OpenAI ChatGPT Image 2.0 vorgestellt, ein Modell, das sich hervorragend für die Darstellung von Text auf Bildern eignet. Mit diesem neuen Ansatz lassen sich hochwertige Bilder ohne weitere Nachbearbeitung erstellen.
Besonderheiten verschiedener KI-Modelle
Die Entwicklung diffuser KI-Modelle läuft bereits seit geraumer Zeit, doch alle bisherigen Varianten verzerrten die Beschriftungen erheblich. Meistens waren die Modelle auf die Erstellung von Mustern ausgerichtet, während der Text nur einen minimalen Teil der Fläche einnahm.
Anschließend begannen die Forscher, autoregressive Modelle zu testen, die nach dem Prinzip der Vorhersage des Bildinhalts funktionieren.
OpenAI gibt bislang keine Details zur Architektur des neuen Modells bekannt. Derzeit ist bekannt, dass Images 2.0 gleichzeitig mehrere Bilder generieren, im Internet nach Daten suchen und sogar die erhaltenen Ergebnisse überprüfen kann. Dadurch ist das neue Modell in der Lage, Marketingmaterialien in verschiedenen Größen zu generieren und auch mit nicht-lateinischen Schriftarten zu arbeiten. Der einzige Nachteil besteht darin, dass die Daten von Images 2.0 auf den Dezember 2025 begrenzt sind, was zu gewissen Ungenauigkeiten bei Anfragen zu aktuellen Ereignissen führen kann.
Das neue Modell generiert komplexe Kompositionen, kurze Texte und Interface-Elemente, doch die Generierung der Ergebnisse dauert etwas länger als bei einer standardmäßigen Textanfrage.
Alle Nutzer von Codex und ChatGPT erhalten Zugang zu dem neuen Modell, und zahlende Nutzer können komplexere Bilder generieren. Darüber hinaus ist die Einführung der API „gpt-image-2“ geplant, bei der die Kosten je nach Auflösung und Bildqualität variieren werden.
Wir hoffen, dass Ihnen dieser Artikel gefallen hat – was meinen Sie? Liken Sie ihn und abonnieren Sie unseren Blog, um weitere praktische Tipps und die neuesten Technologie-News von HostZealot zu erhalten.