Gigabyte
Modell: G893-ZD1-AAX5
Gigabyte's 8U-Plattform für das NVIDIA HGX B200 Motherboard: acht Blackwell B200 SXM GPUs mit jeweils 180GB HBM3e, 1,4TB und 64 TB/s Speicher pro Knoten, verbunden durch fünfte Generation NVLink mit 1,8 TB/s pro GPU via NVSwitch. Dual AMD EPYC 9005 oder 9004 Serie Prozessoren, vierundzwanzig DDR5-Module, acht Gen5 NVMe-Bays und zwölf 3000W Titanium-Netzte in einer 6+6 Redundanzanordnung, gekühlt mit Luft. Die aktuelle Blackwell-Frontier für Single-Node AI, weltweit quotiert und versendet DDP von MillionMiner.
Fordern Sie Ihr Serverangebot an
Teilen Sie uns Ihre Arbeitsbelastung und Ihre Bereitstellungsanforderungen mit. Unser Spezialist antwortet innerhalb von 24 Stunden per E-Mail, WhatsApp oder telefonisch.
Warum dieses Serverangebot nur auf Bestellung erhältlich ist
Diese Server werden individuell konfiguriert und angeboten. Ihre Auswahl bei Build, Speicher, Netzwerk, Garantie und Rack-Integration bestimmt den Endpreis, und Ihr Lieferziel legt Versand- und Zollkosten fest. Füllen Sie das untenstehende Formular aus, und unser Spezialist wird innerhalb von 24 Stunden mit einem vollständigen Angebot inklusive Hardware, Garantie und weltweitem DDP-Versand antworten.
Danke! Unser Spezialist wird Ihnen innerhalb von 24 Stunden ein individuelles Angebot zukommen lassen.
So funktioniert Ihre Serverbestellung
Formular absenden
Arbeitsbelastung und Bereitstellungsdetails teilen
Angebot anfordern
Vollständige Preisgestaltung innerhalb von 24 Stunden
Überprüfung mit Spezialisten
Abschluss der Konfiguration und Lieferung
Lieferung
Versandt und bereit für den Einsatz
Echt
Getestete Hardware
Weltweit
Globaler Versand
Unterstützung
Mining-Experten
Preise, Lieferzeiten und Hosting-Optionen. Persönliche Beratung durch unser Verkaufsteam.
Preise, Lieferzeiten und Hosting-Optionen. Persönliche Beratung durch unser Verkaufsteam.
Kostenloses Angebot, Antwort innerhalb von 24 Stunden. Kein Verkaufsgespräch.
4,7 / 5 auf Trustpilot
Verifizierte Kundenbewertungen
<amount>30.000+</amount> Miner geliefert
Weltweit versendet seit 2020
1.200+ Kunden weltweit
In über 50 Ländern vertrauenswürdig
Jede GPU-Generation wird als Revolution verkauft. Die genaue Bewertung von Blackwell besteht darin, die physischen Änderungen von den Marketingmultiplikatoren zu trennen, und dieser Server belohnt diese Vorgehensweise, weil die physischen Veränderungen erheblich sind.
Die GPU selbst. Jeder NVIDIA B200 ist ein Dual-Die-Package: zwei Dies, jeweils am Limit der Fertigung, verbunden durch eine 10 TB/s die-to-die Schnittstelle und der Software als eine einzelne GPU mit 208 Milliarden Transistoren präsentiert. Jedes trägt 180GB HBM3e bei etwa 8 TB/s Bandbreite, im Vergleich zu 141GB bei 4.8 TB/s beim H200. Die zweite Generation des Transformer Engine erweitert die Präzisionsleiter bis FP4 mit Mikro- tensor-Skalierung, Hardware, die die Quantisierungsskala mit feiner Granularität verfolgt, sodass Vier-Bit-Inferenz die Genauigkeit beibehält, die frühere naive Quantisierung verloren hat. Fifth-Generation NVLink verdoppelt das Fabric auf 1,8 TB/s pro GPU.
Die Mathematik des Nodes. Acht B200 SXM GPUs auf dem HGX-Board bündeln 1.440GB HBM3e, 64 TB/s aggregierten Speicherbandbreite und 144 PetaFLOPS FP4-Rechenleistung, mit NVSwitch, der jede GPU mit jeder anderen bei voller NVLink-Rate verbindet, 14,4 TB/s aggregiertes Fabric. In Bezug auf Workloads: Modelle im niedrigen Hundert-Milliarden-Parameter-Bereich werden innerhalb eines Nodes mit voller Präzision feinabgestimmt, trillionen-Parameter-Modelle laufen in Echtzeit auf einem Node bei FP4, Langkontext-Inference mit KV-Cache-Reservoir, das kein Hopper-Node erreicht, und Mixture-of-Experts-Architekturen routed zwischen Experten auf einem Fabric, das doppelt so schnell ist wie die H200-Generation. NVIDIA's veröffentlichte Vergleiche, bis zu 15x Echtzeit-Trillionen-Parameter-Inference und etwa 3x Training gegenüber der H100-Generation, sind Herstellerangaben, aber die Hardware-Deltas dahinter sind es nicht.
Die Gigabyte-Plattform. Der Host basiert auf dualen AMD EPYC 9005 oder 9004 Serien, mit bis zu 192 Kernen pro Sockel bei der 9005-Reihe, was für Tokenisierung, Augmentierung und Daten-Loading-Arbeiten relevant ist, die acht GPUs dieses Typs speisen. Vierundzwanzig DDR5-Module sind auf je eine Kanalpro Seite verteilt, insgesamt zwölf Kanäle pro Prozessor, eine Konfiguration, die die volle Speicherbandbreite aufrechterhält, anstatt sie für Kapazität zu opfern. Der Speicher umfasst acht Hot-Swap Gen5 NVMe-Bays für lokale Datensätze. Das PCIe-Layout ist für Clustering ausgelegt: acht Einzel-Slot-Positionen für je einen 400 Gb/s Adapter pro GPU, die eins-zu-eins-Topologie, die GPUDirect RDMA bevorzugt, auf NVIDIA Quantum-2 InfiniBand oder Spectrum-X Ethernet, mit vier zusätzlichen Dual-Slot-Positionen für Speicher und Management-Netzwerke. Die Stromversorgung besteht aus zwölf 3000W 80 PLUS Titanium-Netzteilen in einer 6+6 Redundanzkonfiguration, und das thermische Design sorgt dafür, dass der GPU-Komplex vollständig luftgekühlt ist, was die Bereitstellung in gewöhnlichen Rechenzentren ermöglicht, im Gegensatz zu den Minderheiten, die für Flüssigkeitskühlung ausgelegt sind.
Die Entscheidung gegen die H200-Systeme in diesem Katalog. Die Lenovo- und ASUS HGX H200 Plattformen liefern 1,1 TB pro Node auf einem Fabric mit 900 GB/s, und für Teams, die 70B-Klasse-Modelle feinabstimmen oder innerhalb dieses Speichercontainers dienen, bleiben sie die rationale Wahl. Der B200-Node rechtfertigt seinen Aufpreis in drei Situationen: Inferenz-Flotten, die Frontiers-Modelle bedienen, bei denen FP4 die Tokens pro Watt verdoppelt, Trainingsläufe, bei denen das doppelte Fabric und der 60-prozentige Bandbreiten-Gewinn die Zeitpläne komprimieren, die geschäftlichen Mehrwert bieten, und Workloads, die bereits an die Speicherbegrenzung der H200 stoßen. Unter diesen Schwellen gewinnt die Hopper-Ökonomie; bei ihnen gewinnt Blackwell.
Die Entscheidung gegen rack-scale Blackwell. Über dieser Maschine steht der NVIDIA DGX GB200 Klasse, bei dem 72 GPUs eine NVLink-Domäne auf Rack-Ebene teilen. Die Grenze ist die NVLink-Domäne selbst: Wenn Ihr Trainingsparallelsystem mehr als acht GPUs in einem kohärenten Fabric benötigt, ist rack-scale die Lösung, und es bringt Flüssigkeitskühlung, Facility Engineering und eine andere Verpflichtungsebene mit sich. Für alles, was acht Blackwell-GPUs passt, was die große Mehrheit des Unternehmenseinsatzes beim Training und nahezu den gesamten Inference-Serving umfasst, liefert dieser Node die gleiche Generation ohne das Facility-Projekt.
Export-Konformität und Bestellung. Blackwell-Klasse Accelerators unterliegen den US-Exportkontrollen, und MillionMiner bestätigt die Zielortberechtigung im Rahmen jedes Angebots. Jedes System wird auf Bestellung konfiguriert, getestet und weltweit DDP versandt, inklusive Zoll und Einfuhrabgaben. Einsatzplanung und Hosting in den eigenen Rechenzentren von MillionMiner sind für Teams verfügbar, die es vorziehen, die Rack-Leistung nicht vor Ort bereitzustellen.
Generational marketing ist laut, daher hier der Blackwell-Schritt in Zahlen dargestellt. Pro GPU steigt der Speicher von den 141GB des H200 auf 180GB HBM3e, und die Bandbreite von 4,8 auf etwa 8 TB/s, ein Zuwachs von 60 Prozent. Das NVLink-Netz verdoppelt sich, 1,8 TB/s pro GPU gegenüber 900 GB/s, durch NVSwitch im Vollgitter. Pro Knoten ergibt sich daraus ein gemeinsamer GPU-Speicher von 1,4 TB, eine Gesamtdatenrate von 64 TB/s und 144 PetaFLOPS FP4-Computing. Jeder B200 ist eine Dual-Die-Design, zwei Reticle-Limit-Dies, verbunden mit 10 TB/s und präsentiert sich als eine GPU mit 208 Milliarden Transistoren.
Die Präzisionsgeschichte ist ebenso wichtig wie die Bandbreite. Blackwells zweite Generation des Transformer Engine führt FP4 mit Mikro-Tensor-Skalierung ein, was Trillion-Parameter-Modelle von Cluster-Problemen zu Knotenproblemen für Inferenz macht. Die veröffentlichten Zahlen von NVIDIA geben an, dass HGX B200 Echtzeit-Inferenz bei Trillion-Parameter-Workloads bis zu 15x schneller ist als die H100-Generation, mit entsprechend fallendem Energieverbrauch pro Token. Für das Training nennt NVIDIA ungefähr das Dreifache der H100-Generation. Diese Zahlen sind vendorseitig Benchmarks und sollten entsprechend interpretiert werden, aber die dahinter stehenden architektonischen Änderungen – FP4, verdoppeltes Fabric, 60 Prozent mehr Speicherbandbreite – sind physische Fakten.
Die Host-Plattform von Gigabyte hält Schritt. Dual AMD EPYC 9005 oder 9004 Serie Prozessoren erreichen 192 Kerne pro Sockel für vorverarbeitungsintensive Pipelines, mit sechsundzwanzig DDR5-Modulen, je eines pro Kanal in zwölf Kanälen pro Prozessor, die den vollen Speicherbus halten. Acht Gen5 NVMe-Bays halten Datensätze lokal, acht PCIe-Slots mit Einzelplatz für je einen 400 Gb/s Adapter pro GPU für Quantum-2 InfiniBand oder Spectrum-X Clustering, und zwölf 3000W Titanium-Netzteile in 6+6-Redundanz tragen die Anforderung, mit Luftkühlung. Angeboten inklusive Konfiguration und weltweitem Versand DDP durch MillionMiner.
Unsere Mining-Spezialisten können Ihnen dabei helfen, den perfekten Miner für Ihre Ausstattung und Ihr Budget zu finden.
Dies ist die Blackwell-Stufe: acht NVIDIA B200 SXM GPUs auf dem HGX-Baseboard, jeder mit 180GB HBM3e, die 1,4TB GPU-Speicher und 64 TB/s Bandbreite in einem Knoten bündeln. Fünfte Generation NVLink verbindet jede GPU mit 1,8 TB/s über NVSwitch, verdoppelt das H200-Layout, und die zweite Generation Transformer Engine fügt FP4-Genauigkeit hinzu, die NVIDIA bei bis zu 15-facher Echtzeitinferenz für trillionen-Parameter-Modelle gegen die H100-Generation angibt. Gigabyte hostet es auf dualen AMD EPYC 9005 oder 9004 Prozessoren mit vierundzwanzig DDR5-Modulen, acht Gen5 NVMe-Slots und zwölf 3000W Titanium-Netzteilen, die airgekühlt sind. Quoted und weltweit DDP versendet von MillionMiner.
Acht B200 SXM GPUs mit 180 GB pro Karte auf NVSwitch. Inferenz der Trillion-Parameter-Klasse wird zu einem einzelnen, luftgekühlten Knoten.
Zweitgeneration-Transformer-Engine mit Micro-Tensor-Skalierung. NVIDIA gibt bis zu 15-mal schnellere Echtzeit-Inferenz im Vergleich zur H100-Generation an.
Fünftige Generation NVLink mit 1,8 TB/s pro GPU, 14,4 TB/s im gesamten Knoten. Gradient-Synchronisation und MoE-Routing bei doppelt so hoher Hopper-Bandbreite.
NVIDIA
Kontakt für Preis
Supermicro
Kontakt für Preis
ASUS
Kontakt für Preis
Dell
Kontakt für Preis
HGX B200 ist NVIDIA's 8-GPU Blackwell-Baustein: acht B200 SXM GPUs und der NVSwitch-Fabrics, der sie verbindet, geliefert an Hersteller wie Gigabyte, die komplette Server darum herum entwickeln. Die physischen Änderungen gegenüber Hopper: Jeder B200 ist ein Dual-Die-Paket mit 208 Milliarden Transistoren, der Speicher wächst auf 180GB HBM3e pro GPU bei etwa 8 TB/s, NVLink verdoppelt sich auf 1,8 TB/s pro GPU, und die zweite Generation des Transformer Engine fügt FP4-Genauigkeit mit Mikro-Tensor-Skalierung hinzu.
1.440 GB zusammengefasster HBM3e, 64 TB/s gesamte Speicherbandbreite, 144 PetaFLOPS FP4-Rechenleistung und 14,4 TB/s NVLink-Fabric über NVSwitch. In Bezug auf die Arbeitslasten: Feinabstimmung im Vollpräzisionsbereich von Modellen mit mehreren hundert Milliarden Parameter, Echtzeit-FP4-Bereitstellung von Modellen der Trillionen-Parameter-Klasse und langzeitige Inferenz mit KV-Cache-Spielraum, der jeden Hopper-Knoten übertrifft.
Drei Situationen. Inferenz-Flotten an der Frontierskala, bei denen FP4 etwa die Token pro Watt verdoppelt und NVIDIA bis zu 15x Echtzeit-Inferenz von Billionen-Parameter-Modelle gegen die H100-Generation angibt. Trainingsprogramme, bei denen die verdoppelte Fabric und der 60-Prozent-Bandbreiten-Gewinn die Zeitpläne komprimieren und geschäftlichen Nutzen bieten. Und Arbeitslasten, die bereits an die 141GB-Grenze pro GPU des H200 stoßen. Teams, die Modelle der Klasse 70B feinabstimmen oder innerhalb des Hopper-Formats bereitstellen, sind in der Regel besser mit den Lenovo oder ASUS HGX H200 Systemen bedient, und MillionMiner wird beide in dem Angebot modellieren.
Verfügbar, mit Ingenieurwesen. Der Transformer Engine der zweiten Generation implementiert Micro-Tensor-Skalierung, verfolgt die Quantisierungsskala auf feiner Granularität, sodass vierbitige Gewichte die Genauigkeit beibehalten, die naive Quantisierung verliert. Production Serving-Stacks, einschließlich TensorRT-LLM, unterstützen es, und die Inferenz großer Modelle lohnt sich: Der Speicherbedarf halbiert sich im Vergleich zu FP8, und der Durchsatz verdoppelt sich ungefähr. Das Training läuft weiterhin mit FP8 und BF16; FP4 ist ein wirtschaftliches Tool für die Inferenz, und ein großes auf Flottenebene.
Ja, das ist die technische Grundannahme dieser Gigabyte-Plattform: ein 8U-Gehäuse mit dem Luftstromvolumen, um den vollständigen HGX B200-Komplex bei Spezifikation ohne direkte Flüssigkeitskühlung unterzubringen. Die praktische Folge ist ein hoher Einsatzfreiheit, da keine Kühlmittelverteilung, Rohrleitungen oder Wartung des Flüssigkeitskreislaufs erforderlich sind und jedes Rechenzentrum mit ausreichender Leistung und konventioneller Kühlung qualifiziert ist. MillionMiner bestätigt die Anforderungen an den Luftstrom und die Eintrittstemperatur für Ihren Standort während des Angebots.
Kerzverdichtung und Speicherbandbreite. Die EPYC 9005-Serie erreicht 192 Kerne pro Sockel, was auf preprocessing-intensive Pipelines für acht GPUs dieser Klasse entfällt, und die Plattform nutzt zwölf DDR5-Kanäle pro Prozessor, wobei die vierundzwanzig Module jeweils einen pro Kanal bestückt sind – die Anordnung, die die volle Bandbreite ermöglicht. Das PCIe Gen5-Lane-Budget trägt ebenfalls die Netzwerk-Topologie mit einem Adapter pro GPU ohne Kompromisse. Die 9004-Serie ist weiterhin für Teams erhältlich, die darauf standardisiert sind.
Die Grenze ist das NVLink-Domain. Dieses Node verbindet acht GPUs in einem kohärenten Netzwerk; die GB200-Klasse verbindet 72 im Rack-Format, mit Flüssigkeitskühlung und Anlagenengineering im gleichen Umfang. Wenn Ihr Training parallelismus tatsächlich mehr als acht GPUs in einem einzigen Domain erfordert, ist rack-scale die Lösung. Für alles, was in acht Blackwell GPUs passt – was den Großteil des Unternehmens-Trainings und fast den gesamten Inference-Service abdeckt – liefert dieses Node die gleiche Generation ohne das Anlagenprojekt und skaliert stattdessen über InfiniBand.
Durch die one-adapter-per-GPU-Topologie ist das PCIe-Layout für folgende Konfigurationen ausgelegt: Acht Einzelplatz-Positionen nehmen 400 Gb/s Adapter auf NVIDIA Quantum-2 InfiniBand oder Spectrum-X Ethernet, wodurch GPUDirect RDMA einen dedizierten Fabrikanschluss pro GPU erhält, sodass Gradienten zwischen Knoten ohne Eingriff der CPU übertragen werden. Vier zusätzliche Doppelplatz-Positionen tragen Speicher- und Managementnetzwerke. MillionMiner berät bei Schalter- und Fabrikdesign, wenn eine Bereitstellung die Größe einer Maschine übersteigt.
Zwölf 3000W 80 PLUS Titanium Netzteile in einer 6+6 redundanten Anordnung bestimmen die Grenzen, wobei der GPU-Komplex allein unter Dauerbelastung acht Kilowatt ziehen kann, bevor das Host-System gezählt wird. Dies ist eindeutig eine Data-Center-Maschine. MillionMiner bestätigt den genauen Verbrauch Ihrer spezifischen Konfiguration während des Angebots und das Hosting in den eigenen Einrichtungen von MillionMiner ist für Teams verfügbar, die es vorziehen, keine Rack-Stromversorgung in diesem Maßstab bereitzustellen.
Reichen Sie Ihre Arbeitsbelastung, Skalierungs- und Bereitstellungsdetails über das Angebotsformular ein. Ein MillionMiner-Spezialist bestätigt die Konfiguration, die Eignung des Zielorts im Rahmen der US-Exportkontrollen, die für Blackwell-Klassen-Acceleratoren gelten, sowie den Lieferplan. Jedes System wird vor dem Versand getestet und weltweit DDP geliefert, inklusive Zollabwicklung. Rack-Integrationsanleitung und gehostete Bereitstellung sind ebenfalls verfügbar.