NVIDIA hat diese Woche den weltweit kleinsten AI Supercomputer DGX Spark offiziell vorgestellt und damit ein neues Kapitel in der Desktop-AI-Computing eröffnet. Dieses revolutionäre Gerät integriert die leistungsstärkste AI-Technologie von NVIDIA in einem kompakten Desktop-Format und bietet Entwicklern die Möglichkeit, große Sprachmodelle lokal zu trainieren und zu inferieren.
Um die Einführung der ersten DGX Spark zu feiern, reiste NVIDIA-Gründer und CEO Jensen Huang persönlich zum SpaceX-Hauptquartier in Texas, um die erste Charge der DGX Spark an SpaceX-Gründer Elon Musk zu übergeben. Dies stellte einen historischen Moment dar, in dem Huang 2016 persönlich den weltweit ersten DGX-1 Supercomputer an Musk übergab, und symbolisiert die Fortsetzung der KI-Revolution.
Der weltweit kleinste AI Supercomputer NVIDIA DGX Spark wird bald erhältlich sein.
Die rasante Entwicklung und Nachfrage von KI hat die Arbeitslast, auf die Millionen von Entwicklern zuvor auf PCs, Workstations und Laptops angewiesen waren, überstiegen und zwingt Teams dazu, die Arbeit in die Cloud oder lokale Rechenzentren zu verlagern. DGX Spark ist ein neuer Computertyp, der in einem kompakten und handlichen Computerdesign AI-Leistung von Billionen von Fließkommaoperationen und 128 GB einheitlichem Speicher bietet, sodass Entwickler lokal Inferenzen mit AI-Modellen durchführen können, die bis zu 200 Milliarden Parameter enthalten, und Modelle mit bis zu 70 Milliarden Parametern feinabstimmen können. Darüber hinaus ermöglicht DGX Spark Entwicklern, lokal AI-Agenten zu erstellen, die fortschrittliche Software-Stacks ausführen.
Jensen Huang persönlich bei SpaceX, um DGX Spark an Musk zu übergeben.
Jensen Huang erklärte, dass NVIDIA 2016 den DGX-1 entwickelt hat, um eine spezielle Supercomputer für KI-Forscher bereitzustellen. Er übergab damals persönlich das erste System an Elon Musk, der zu dieser Zeit noch bei OpenAI gründete. So entstand ChatGPT und leitete die KI-Revolution ein. Der erste Supercomputer, der 2016 auf den Markt kam, wog 134 Pfund und kostete 129.000 US-Dollar. Jetzt wiegt er nur noch 2,65 Pfund und kostet nur 3.999 US-Dollar. Die GPU-Architektur hat sich von NVIDIA Pascal zu Blackwell weiterentwickelt.
Andere frühe Empfänger von DGX Spark, darunter Anaconda, Cadence, ComfyUI, Docker, Google, Hugging Face, JetBrains, LM Studio, Meta, Microsoft, Ollama und Roboflow, testen die Validierung und Optimierung ihrer Tools, Software und Modelle für DGX Spark. Globale Forschungsinstitute, darunter das Global Frontier Lab der New York University, haben einen Vorgeschmack auf DGX Spark erhalten, um ihre KI-Entwicklung zu fördern. Kyunghyun Cho, Professor für Computer- und Datenwissenschaften am Global Frontier Lab der New York University, erklärte, dass der neue Ansatz von DGX Spark in der Lage ist, Prototypen schnell zu erstellen und fortschrittliche KI-Algorithmen und -Modelle auszuprobieren, selbst für Anwendungen, die empfindlich auf Datenschutz und Sicherheit reagieren, wie im Gesundheitswesen.
Anwendungsfälle von DGX Spark
DGX Spark integriert die vollständige NVIDIA AI-Plattform (einschließlich GPU, CPU, Netzwerk, CUDA®-Bibliotheken und NVIDIA AI-Software-Stack) in ein kompaktes System, das klein genug ist, um in einem Labor oder Büro Platz zu finden, aber leistungsstark genug, um die Entwicklung von Agenten und physischen KI-Anwendungen zu beschleunigen. Durch die Kombination bahnbrechender Leistung mit der Reichweite des NVIDIA-Ökosystems verwandelt DGX Spark den Desktop in eine AI-Entwicklungsplattform.
Das DGX Spark-System bietet eine AI-Leistung von bis zu 1 Petaflop, beschleunigt durch den NVIDIA GB10 Grace Blackwell Superchip, die NVIDIA ConnectX®-7 200 Gb/s Netzwerktechnologie und die NVIDIA NVLink-C2C-Technologie, die eine 5-fache Bandbreite im Vergleich zur fünften PCIe-Generation und eine Speicher- und CPU-Konsistenz gemäß PCIe bietet.
Die vorinstallierte NVIDIA AI-Software-Stack ermöglicht es Entwicklern, sofort mit AI-Projekten zu beginnen. Mit DGX Spark können Entwickler auf die Tools des NVIDIA AI-Ökosystems zugreifen, einschließlich Modelle, Bibliotheken und NVIDIA NIM-Mikrodienste, um lokale Workflows zu realisieren, wie z. B. die Anpassung des FLUX.1-Modells von Black Forest Labs zur Optimierung der Bildgenerierung, die Erstellung von visuellen Such- und Zusammenfassungsagenten mit dem NVIDIA Cosmos Reason visuellem Sprachmodell oder die Version des Zusammenfassungsroboters für DGwen X3.
Dieser Artikel feiert die Einführung des weltweit kleinsten AI-Supercomputers durch NVIDIA! Jensen Huang reist persönlich zu SpaceX, um die ersten Einheiten an Musk zu liefern. Zuerst erschienen in Chain News ABMedia.