Supermicro

Supermicro HGX H800 SuperServer SYS-821GE-TNHR

Modell: SYS-821GE-TNHR

Supermicro's 8U SuperServer, gebaut um das NVIDIA HGX H800 8-GPU Basismodul: acht H800 SXM GPUs mit 640GB zusammengeschlossener HBM3, voller Hopper FP8 Transformer Engine Durchsatz und NVSwitch Interconnect, untergebracht in dualen Intel Xeon Scalable Prozessoren mit bis zu 8TB DDR5-Speicher. Die Hopper-Generation der Rechenleistung, die Frontier-Modelle trainierte, auf einer Supermicro Plattform mit Luft- oder optionaler Flüssigkeitskühlung. Angebot und weltweiter Versand DDP durch MillionMiner.

Fordern Sie Ihr Serverangebot an

Teilen Sie uns Ihre Arbeitsbelastung und Ihre Bereitstellungsanforderungen mit. Unser Spezialist antwortet innerhalb von 24 Stunden per E-Mail, WhatsApp oder telefonisch.

Warum dieses Serverangebot nur auf Bestellung erhältlich ist

Diese Server werden individuell konfiguriert und angeboten. Ihre Auswahl bei Build, Speicher, Netzwerk, Garantie und Rack-Integration bestimmt den Endpreis, und Ihr Lieferziel legt Versand- und Zollkosten fest. Füllen Sie das untenstehende Formular aus, und unser Spezialist wird innerhalb von 24 Stunden mit einem vollständigen Angebot inklusive Hardware, Garantie und weltweitem DDP-Versand antworten.

So funktioniert Ihre Serverbestellung

1

Formular absenden

Arbeitsbelastung und Bereitstellungsdetails teilen

2

Angebot anfordern

Vollständige Preisgestaltung innerhalb von 24 Stunden

3

Überprüfung mit Spezialisten

Abschluss der Konfiguration und Lieferung

4

Lieferung

Versandt und bereit für den Einsatz

Echt

Getestete Hardware

Weltweit

Globaler Versand

Unterstützung

Mining-Experten

Vollständige Spezifikationen

Modell SYS-821GE-TNHR
Formfaktor 8U Rackmount
GPUs NVIDIA HGX H800 baseboard — 8x H800 SXM, 80GB HBM3 each, 640GB total
Gesamtspeicher der GPU 640GB HBM3 (8x 80GB)
GPU-Verbindung NVSwitch full-mesh, 400 GB/s NVLink per GPU
Prozessoren Dual Intel Xeon Scalable, LGA-4677 (up to 64C/128T per CPU)
Speicher 32 DIMM slots, up to 8TB ECC DDR5
Vernetzung 2x 10GbE RJ45, 2x 25GbE SFP28 (optional), PCIe expansion for fabric adapters
Speicher 12 NVMe and 3 SATA drive bays, 2 M.2 NVMe slots
Kühlung 10 heavy-duty fans (air); optional direct liquid cooling
Stromversorgung 6x 3000W redundant
Management SuperCloud Composer, Supermicro Server Manager
Sicherheit TPM 2.0, Silicon Root of Trust

Fordern Sie ein Angebot für das Hosting eines Bitcoin Miners an

Kostenloses Angebot, Antwort innerhalb von 24 Stunden. Kein Verkaufsgespräch.

4.4
Stern Stern Stern Stern Stern

4,7 / 5 auf Trustpilot

Verifizierte Kundenbewertungen

<amount>30.000+</amount> Miner geliefert

Weltweit versendet seit 2020

1.200+ Kunden weltweit

In über 50 Ländern vertrauenswürdig

ISO Hergestellt in Deutschland trustpilot
Google-Bewertung

Erhalten Sie ein Angebot für die Supermicro HGX H800 SuperServer SYS-821GE-TNHR

Preise, Lieferzeiten und Hosting-Optionen. Persönliche Beratung durch unser Verkaufsteam.

Antwortet innerhalb von 24 Stunden via E-Mail, WhatsApp oder Anruf.

Produktdetails

Supermicro HGX H800 SuperServer SYS-821GE-TNHR: Was der H800 wirklich ist, Node-Scale-Spezifikationen und der ehrliche Entscheidungsfindungsrahmen gegenüber H100- und A100-Systemen

Der Großteil der Informationen, die Käufer über den H800 lesen, ist entweder abwertend oder ausweichend. Die genaue Version ist hilfreicher: Der H800 ist die exportkonforme Variante des H100, gebaut auf identischem Hopper-Silicon, und die Frage, ob er für Ihre Einsatzumgebung geeignet ist, lässt sich klar beantworten, sobald Sie wissen, welche zwei Spezifikationen geändert wurden und ob Ihre Arbeitsbelastung diese betrifft.

Was identisch mit dem H100 ist. Der GPU-Die, die 80GB HBM3-Speicher bei voller Bandbreite, die viert Generation Tensor Cores und der vollständige Präzisions-Stack, den AI-Arbeiten tatsächlich verwenden: FP8 durch den Transformer Engine, BF16, FP16 und TF32. Ein Acht-GPU-Knoten liefert 640GB reinen HBM3-Speicher, eine aggregierte Speicherbandbreite von über 26 TB/s und FP8-Durchsatz in derselben Klasse wie ein H100-Knoten, über 30 PetaFLOPS. Die MIG-Partitionierung ist ebenfalls intakt, bis zu sieben isolierte Instanzen pro GPU, sodass ein Server mehr als fünfzig hardwarepartitionierte Segmente für Multi-Tenant-Inference bereitstellen kann.

Was reduziert wurde und wann es relevant ist. Erstens, NVLink: 400 GB/s pro GPU statt 900. Innerhalb eines einzelnen Knotens verbindet NVSwitch weiterhin alle acht GPUs in einem vollständigen Mesh, und 400 GB/s bleiben mehr als das Dreifache der PCIe Gen 5-Bandbreite, sodass Einzelknoten-Training, Feinabstimmung und Inference kaum betroffen sind. Die Reduktion betrifft vor allem die Multi-Knoten-Grenze, bei der die Gradienten-Synchronisierung über Dutzende von Knoten hinweg auf jedes Gigabyte Fabric-Bandbreite angewiesen ist. Zweitens, FP64: stark gekürzt, was den H800 für Double-Precision wissenschaftliche Simulationen disqualifiziert. AI-Training verwendet kein FP64. Wenn Ihre Arbeit beispielsweise numerische Strömungsmechanik oder Klimamodellierung ist, sollten Sie ein H100-System kaufen; wenn es um Sprachmodelle, Vision oder Empfehlungssysteme geht, ist diese Reduktion für Sie irrelevant.

Der Beweis, auf dem Record. DeepSeek hat V3 und R1 auf H800-Cluster trainiert und die Engineering-Dokumentation veröffentlicht. Diszipliniertes Parallelismus-Strategie auf genau dieser GPU hat Modelle erzeugt, die mit den globalen Vorreitern konkurrieren. Das macht die NVLink-Reduktion nicht ungeschehen; es zeigt jedoch, dass die Rechenleistung, der Speicher und der FP8-Durchsatz des H800 wirklich katzengleich sind, und dass die Begrenzung eine technische Überlegung und kein Limit ist.

Der Supermicro-Host. Dies ist ein 8U SuperServer mit dualen Intel Xeon Scalable Prozessoren auf LGA-4677, bis zu 64 Kerne und 128 Threads pro Sockel. Der Speicher skaliert auf 8TB ECC DDR5 über 32 DIMM-Slots, was die Regel “System-Speicher über GPU-Speicher” mehrfach übertrifft und Platz für das In-Memory-Preprocessing schafft, das große Dataset-Pipelines benötigen. Das Storage umfasst zwölf Hot-Swap NVMe-Slots und drei SATA-Bays für Kapazität, mit zwei M.2-Slots, die das Betriebssystem vom Dataset-Pfad fernhalten. Netzwerktechnisch ist das System mit dualen 10GbE onboard ausgestattet und optional mit 25GbE, dazu PCIe-Erweiterungen für Fabric-Adapter für GPUDirect RDMA, wenn die Deployment-Umgebung über einen Knoten hinausgeht. Die Versorgung erfolgt durch sechs redundante 3000W-Netzteile; die Kühlung durch zehn Heavy-Duty-Lüfter, die mit Luft arbeiten, wobei direkte Flüssigkeitskühlung optional für Standorte mit dichter Knotenkonfiguration verfügbar ist. Supermicro’s Management-Stack, SuperCloud Composer und Supermicro Server Manager, übernimmt den Flottenbetrieb, mit TPM 2.0 und Silicon Root of Trust dahinter.

Wo es in diesem Katalog steht. Gegenüber den drei A100-Systemen, dem DGX A100, dem Supermicro AS-4124GO-NART+ und dem Exeton Quasar 640X, ist dieser Knoten eine ganze Generation voraus, wo es zählt: FP8 Transformer Engine-Durchsatz, den die Ampere-Generation nicht hat, HBM3 gegen HBM2e, und die gleiche 640GB pro Knoten. Gegen die H100- und H200-Systeme, die Lenovo- und ASUS-HGX-Plattformen, ist der H800 die Value-Position innerhalb der Hopper-Generation: Single-Node-Performance in derselben Klasse, mit den Reduktionen bei NVLink und FP64 eingepreist. Der Käufer, für den das passt, führt Training, Feinabstimmung oder Inference im Bereich von einem bis wenigen Knoten durch und möchte, dass die Hopper-Wirtschaftlichkeit das widerspiegelt. Der Käufer, für den es nicht passt, führt FP64-Simulationen oder Multi-Node-Training im Cluster-Format durch, und MillionMiner wird dies im Angebotsgespräch klarstellen, bevor es zur Lieferung kommt.

Hinweis zur Exportkonformität: Der H800 unterliegt den US-Exportkontrollen, und MillionMiner bestätigt die Zielbestimmung als Teil jedes Angebots. Jedes System wird auf Bestellung konfiguriert, getestet und weltweit DDP versendet, inklusive Zölle und Zollabwicklung. Hosting in den eigenen Rechenzentren von MillionMiner ist für Teams verfügbar, die nicht vor Ort zehn Kilowatt Rack-Leistung bereitstellen möchten.

Supermicro HGX H800 SuperServer: Der Hopper Compute, der DeepSeek trainierte, ehrlich gesagt

Der H800 verdient eine ehrlichere Einführung, als er normalerweise erhält. Es ist kein abgespeckter Nachzügler. Es ist H100-Silizium: die gleiche Hopper-Architektur, die gleichen 80GB HBM3 bei voller Speicherbandbreite, die gleichen vierte Generation Tensor Cores und FP8 Transformer Engine, die diese GPU-Generation definieren. Zwei Dinge wurden für Exportkonformität reduziert: NVLink-Bandbreite, von 900 auf 400 GB/s pro GPU, und FP64-Durchsatz, was für wissenschaftliche Simulationen wichtig ist und in der KI fast nichts mehr bedeutet. Alles, worauf ein Trainingslauf oder eine Inferenzflotte tatsächlich angewiesen ist – FP8, BF16, TF32-Compute und HBM3-Bandbreite – ist intakt.

Der Beweis ist öffentlich. DeepSeek hat V3 und R1 trainiert, Modelle, die die globale KI-Diskussion neu ordneten, auf Clustern genau dieser GPU. Die NVLink-Reduktion ist real und zeigt sich bei der Multi-Node-Gradientensynchronisation im großen Cluster. Innerhalb eines einzelnen Nodes, wo NVSwitch noch alle acht GPUs in einem Full Mesh verbindet, laufen Fine-Tuning, Training und Inferenz mit Hopper-Geschwindigkeit.

Die Supermicro-Plattform rund um das Basis-Board ist großzügig dimensioniert. Dual Intel Xeon Scalable Prozessoren mit bis zu 64 Kernen pro Stück übernehmen Preprocessing und Data Loading. Zweiunddreißig DIMM-Steckplätze skalieren auf 8TB ECC DDR5, eine Größenordnung über dem GPU-Pool von 640GB und weit über die Größenregel, die unterdimensionierte Hosts verletzen. Zwölf NVMe-Bays plus drei SATA-Bays halten Datensätze lokal, zwei M.2-Steckplätze isolieren den Bootpfad, und sechs 3000W redundante Netzteile sorgen für die etwa zehn Kilowatt Gesamtleistung. Zehn Hochleistungs-Lüfter sorgen für Luftkühlung, mit optionaler Flüssigkeitskühlung für dichte Rack-Deployments. Angebotene Konfiguration und weltweiter Versand DDP durch MillionMiner.

Brauchen Sie Hilfe bei der Auswahl?

Unsere Mining-Spezialisten können Ihnen dabei helfen, den perfekten Miner für Ihre Ausstattung und Ihr Budget zu finden.

Supermicro SYS-821GE-TNHR: 8x H800 Hopper SuperServer

Der H800 ist die GPU, die einen Punkt bewies: DeepSeek hat seine V3- und R1-Frontier-Modelle auf H800-Cluster trainiert, die mit demselben Hopper-Silizium, 80GB HBM3 und FP8 Transformer Engine wie der H100 laufen. Dieser Supermicro 8U SuperServer trägt acht von ihnen auf einem NVSwitch-Baseboard, 640GB GPU-Speicher pro Knoten, hinter dualen Intel Xeon Scalable Prozessoren, bis zu 8TB DDR5 über 32 DIMM-Steckplätze, zwölf NVMe-Bays und sechs redundanten 3000W-Stromversorgungen. Zehn Heavy-Duty-Lüfter kühlen ihn an der Luft, mit optionaler Flüssigkeitskühlung. Hopper-Klasse Training und Inferenz, quoted und weltweit versandt DDP durch MillionMiner.

Die GPU, die DeepSeek trainierte

H800-Cluster trainierten DeepSeek V3 und R1. Gleiches Hopper-Silizium, 80GB HBM3 und FP8 Transformer Engine wie die H100, bewährt an der Front.

640GB HBM3, Full Hopper FP8 pro Node

Acht H800 SXM GPUs auf NVSwitch liefern über 30 PetaFLOPS FP8 und 26 TB/s summierte Speicherbandbreite. MIG teilt jede GPU in sieben Teile.

Ein Supermicro-Host mit echtem Spielraum

Bis zu 8TB DDR5 über 32 DIMMs, zwölf NVMe-Bays, sechs redundante 3000W-Netzteile, zehn Lüfter an Luft mit optionaler Flüssigkeitskühlung.

Häufig gestellte Fragen

Häufig gestellte Fragen

Der H800 ist die exportkonforme Variante des H100, gebaut auf identischem Hopper-Silizium mit den gleichen 80GB HBM3 bei voller Bandbreite und dem gleichen FP8 Transformer Engine. Zwei Spezifikationen wurden reduziert: NVLink-Bandbreite, 400 GB/s pro GPU statt 900, und FP64-Durchsatz, der bei wissenschaftlichen Simulationen statt bei KI verwendet wird. Für Training, Feinabstimmung und Inferenz entsprechen die Rechen- und Speicherleistungen, die Sie tatsächlich nutzen, dem H100.

Die öffentliche Aufzeichnung beantwortet das. DeepSeek trainierte V3 und R1, Frontier-Modelle nach jeder Messgröße, auf H800-Clustern und veröffentlichte die technische Grundlage dafür. Der FP8-Durchsatz der GPU, die HBM3-Bandbreite und die Tensor Core-Architektur sind H100-Klasse, weil sie aus dem gleichen Silicon bestehen. Die NVLink-Reduktion ist eine technische Überlegung im Multi-Node-Design, kein Leistungslimit.

Auf Multi-Node-Cluster-Ebene. Innerhalb eines Servers verbindet NVSwitch immer noch alle acht GPUs in einem Vollmesh mit jeweils 400 GB/s, mehr als Dreimal PCIe Gen 5, sodass Single-Node-Training und Feinabstimmung kaum betroffen sind. Das Synchronisieren von Gradienten über Dutzende von Nodes ist der Bereich, in dem die Kluft zur 900 GB/s H100-Fabric sich vergrößert. Käufer, die ein bis wenige Nodes betreiben, merken das kaum; Käufer, die große Cluster planen, sollten die H100- und H200-Systeme in diesem Katalog abwägen, und MillionMiner wird beide im Angebot berücksichtigen.

Nicht bei Double-Precision-Arbeiten. Der FP64-Durchsatz des H800 wurde im Rahmen der Exportbestimmungen drastisch reduziert, was ihn für berechnungsintensive Fluiddynamik, Klimamodellierung und ähnliche FP64-Arbeiten disqualifiziert. Für diese Aufgaben behalten die Systeme H100 und H200 in diesem Katalog die volle FP64 Tensor-Leistung bei. Für AI-Training und -Inference, die FP8, BF16 und TF32 verwenden, ist die Reduktion irrelevant.

Acht H800 SXM GPUs mit 640 GB zusammengeschaltetem HBM3, einer aggregierten Speicherbandbreite von über 26 TB/s, FP8 Transformer Engine-Durchsatz jenseits von 30 PetaFLOPS und vollständigem Mesh NVSwitch-Interconnect. Jede GPU unterteilt sich in bis zu sieben MIG-Instanzen, sodass der Knoten mehr als fünfundzwanzig hardware-isolierte GPU-Segmente für Multi-Tenant-Inference-Serving bereitstellen kann.

Dual Intel Xeon Scalable Prozessoren on LGA-4677, bis zu 64 Kerne und 128 Threads pro Sockel, mit 32 DIMM-Steckplätzen, die auf 8TB ECC DDR5 skalieren. Der Speicher verfügt über zwölf Hot-Swap NVMe-Bays plus drei SATA-Bays, mit zwei M.2-Steckplätzen, die den Bootpfad vom Dataset-I/O trennen. Die Netzwerkverbindung ist mit dual 10GbE onboard, optional 25GbE, und PCIe-Erweiterungen für Fabric-Adapter ausgestattet. Supermicro's SuperCloud Composer und Server Manager kümmern sich um das Flottenmanagement, mit TPM 2.0 und Silicon Root of Trust für die Plattform-Sicherheit.

Nein. Zehn Heavy-Duty-Lüfter kühlen den Node mit Standard-Rechenzentrum-Luft, was den Einsatz in gewöhnlichen Einrichtungen ermöglicht. Direktflüssigkeitskühlung ist als Option erhältlich für Standorte, die Nodes mit hoher Rack-Dichte platzieren, und MillionMiner berät Sie bei der Auswahl der geeigneten Konfiguration für Ihre Einrichtung während des Angebots.

Es ist eine volle Generation voraus, bei der AI-Workloads bemerkbar werden. Der Hopper FP8 Transformer Engine verdoppelt die effektive Trainingsdurchsatzrate im Vergleich zu Ampere bei gleichem Node-Speicher, HBM3 übertrifft die HBM2e des A100, und NVSwitch-Bandbreite pro GPU ist vergleichbar mit dem 600 GB/s Fabric des A100. Beide liefern 640GB pro Node. Teams, die zwischen ihnen wählen, wägen die Ampere-Ökonomie gegen den Hopper-Throughput ab, und MillionMiner zitiert beide ehrlich.

Die Leistung einzelner Knoten liegt in der gleichen Klasse wie ein H100-System, da Silizium, Speicher und FP8-Throughput übereinstimmen. Die Plattformen H100 und H200 rechtfertigen ihre Position mit vollem 900 GB/s NVLink für Multi-Node-Skalierung, vollem FP64 für HPC und im Fall des H200 141GB HBM3e pro GPU. Der H800 ist die Preis-Leistungs-Position innerhalb der Hopper-Generation für One-to-Few-Node AI-Einsätze. Overgrow ihn, und der Upgrade-Pfad ist bereits in diesem Katalog enthalten.

Reichen Sie Ihre Arbeitslast und Bereitstellungsdetails über das Angebotsformular ein, und ein MillionMiner-Spezialist bestätigt die Konfiguration, die Eignung des Ziels unter den US-Exportkontrollen, die auf den H800 anwendbar sind, sowie den Lieferplan. Jedes System wird vor dem Versand getestet und weltweit DDP geliefert, inklusive aller Zölle und Zollabfertigung. Hosting in den eigenen Rechenzentren von MillionMiner ist als Alternative zur Vor-Ort-Bereitstellung verfügbar.