NVLM 1.0 von NVIDIA: Eine leistungsstarke Alternative zu GPT-4o mit beeindruckenden Ergebnissen

watch 1m, 11s
views 2

14:48, 19.09.2024

NVIDIA hat eine neue Familie von multimodalen NVLM-Modellen (NVIDIA Vision Language Model) angekündigt, die hervorragende Ergebnisse bei einer Reihe von visuellen und sprachlichen Aufgaben liefern. Die Familie umfasst drei Hauptmodelle: NVLM-D (Decoder-only Model), NVLM-X (X-attention Model) und NVLM-H (Hybrid Modell), die jeweils in Konfigurationen mit 34 und 72 Milliarden Parametern erhältlich sind.

Eine der wichtigsten Eigenschaften der Modelle ist ihre Fähigkeit, visuelle Aufgaben effizient zu bewältigen. Im OCRBench-Test, der die Fähigkeit testet, Text aus Bildern zu erkennen, übertraf das NVLM-D-Modell das GPT-4o von OpenAI, ein wichtiger Durchbruch bei multimodalen Lösungen. Außerdem sind die Modelle in der Lage, Meme zu verstehen, menschliche Handschriften zu analysieren und Fragen zu beantworten, die eine genaue Analyse der Position von Objekten in Bildern erfordern.

NVLMs schneiden auch bei Mathematikaufgaben gut ab, wo sie die Modelle von Google übertreffen und nur drei Punkte hinter dem Spitzenreiter, dem Modell Claude 3.5 des Startups Anthropic, liegen.

Jedes der drei Modelle hat unterschiedliche Eigenschaften.

  • NVLM-D verwendet einen vortrainierten Encoder und ein mehrschichtiges Perzeptron, was es kostengünstig macht, aber mehr GPU-Ressourcen erfordert.
  • NVLM-X verwendet einen Cross-Attention-Mechanismus, der besser mit hochauflösenden Bildern umgehen kann.
  • NVLM-H kombiniert die Vorteile beider Modelle und schafft ein Gleichgewicht zwischen Effizienz und Genauigkeit.

NVIDIA baut seine Position im Bereich der künstlichen Intelligenz weiter aus, indem es Lösungen anbietet, die sowohl für die Forschung als auch für die Wirtschaft von Nutzen sein können.

Teilen

War dieser Artikel für Sie hilfreich?

1 Benutzer halten diesen Artikel für hilfreich

VPS beliebte Angebote

-22.2%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 4096 HK Linux

33 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 2048 Linux

8.3 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
KVM-SSD 8192 Linux

25.85 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 4096 Linux

16.45 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 8192 Linux

115.5 /mo

/mo

Alle 12 Monate abgerechnet

-20.4%

CPU
CPU
2 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 2048 HK Linux

18 /mo

/mo

Alle 12 Monate abgerechnet

-16.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-KVM 2048 Linux

48 /mo

/mo

Alle 12 Monate abgerechnet

-9.9%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB HDD
Bandwidth
Bandwidth
300 Gb
KVM-HDD HK 4096 Linux

12.09 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
8 Xeon Cores
RAM
RAM
32 GB
Space
Space
200 GB SSD
Bandwidth
Bandwidth
12 TB
KVM-SSD 32768 Metered Linux

150 /mo

/mo

Alle 12 Monate abgerechnet

-10%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-KVM-SSD 4096 Linux

60.5 /mo

/mo

Alle 12 Monate abgerechnet

Weitere Artikel zu diesem Thema

cookie

Cookies und Datenschutz akzeptieren?

Wir verwenden Cookies, um sicherzustellen, dass wir Ihnen die beste Erfahrung auf unserer Website bieten. Wenn Sie fortfahren, ohne Ihre Einstellungen zu ändern, gehen wir davon aus, dass Sie mit dem Empfang aller Cookies auf der HostZealot-Website einverstanden sind.