Supermicro

Supermicro GPU A+ Server AS-8126GS-NB3RT NVIDIA HGX B300 NVL8

Modell: AS-8126GS-NB3RT

Supermicro's 8U A+ Plattform für das NVIDIA HGX B300 NVL8 Motherboard: acht Blackwell Ultra B300 SXM GPUs mit jeweils 288 GB HBM3e, die 2,3 TB GPU-Speicher pro Node hinter der fünften Generation NVLink und NVSwitch bündeln, mit integrierten 800 Gb/s Fabric-Ports auf dem Motherboard selbst. Dual AMD EPYC 9005 oder 9004 Serie Prozessoren, bis zu 6TB DDR5 6400, acht E1.S NVMe-Bays und sechs 6600W Titanium-Netzteile tragen es. Der Inferenz- und Trainingsknoten der Rationalitäts-Ära, zitiert und weltweit DDP von MillionMiner versandt.

Fordern Sie Ihr Serverangebot an

Teilen Sie uns Ihre Arbeitsbelastung und Ihre Bereitstellungsanforderungen mit. Unser Spezialist antwortet innerhalb von 24 Stunden per E-Mail, WhatsApp oder telefonisch.

Warum dieses Serverangebot nur auf Bestellung erhältlich ist

Diese Server werden individuell konfiguriert und angeboten. Ihre Auswahl bei Build, Speicher, Netzwerk, Garantie und Rack-Integration bestimmt den Endpreis, und Ihr Lieferziel legt Versand- und Zollkosten fest. Füllen Sie das untenstehende Formular aus, und unser Spezialist wird innerhalb von 24 Stunden mit einem vollständigen Angebot inklusive Hardware, Garantie und weltweitem DDP-Versand antworten.

So funktioniert Ihre Serverbestellung

1

Formular absenden

Arbeitsbelastung und Bereitstellungsdetails teilen

2

Angebot anfordern

Vollständige Preisgestaltung innerhalb von 24 Stunden

3

Überprüfung mit Spezialisten

Abschluss der Konfiguration und Lieferung

4

Lieferung

Versandt und bereit für den Einsatz

Echt

Getestete Hardware

Weltweit

Globaler Versand

Unterstützung

Mining-Experten

Vollständige Spezifikationen

Modell AS-8126GS-NB3RT
Formfaktor 8U Rackmount
GPUs 8x NVIDIA B300 (Blackwell Ultra) SXM, 288GB HBM3e each
Gesamtspeicher der GPU 2.3TB HBM3e (2,304GB pooled)
Vernetzung NVIDIA NVLink 5 and NVSwitch, 1.8 TB/s per GPU
Prozessoren Dual AMD EPYC™ 9005/9004 Series
Speicherunterstützung Up to 6TB DDR5, 6400 MT/s
DIMM-Steckplätze 24
Netzwerkschnittstellen 8x OSFP 800 Gb/s (integrated on baseboard)
PCIe Steckplätze 2x PCIe 5.0 x16 FHHL
Laufwerk-Schächte 8x front hot-swap E1.S NVMe
Netzteile 6x 6600W Redundant Titanium Level

Fordern Sie ein Angebot für das Hosting eines Bitcoin Miners an

Kostenloses Angebot, Antwort innerhalb von 24 Stunden. Kein Verkaufsgespräch.

4.4
Stern Stern Stern Stern Stern

4,7 / 5 auf Trustpilot

Verifizierte Kundenbewertungen

<amount>30.000+</amount> Miner geliefert

Weltweit versendet seit 2020

1.200+ Kunden weltweit

In über 50 Ländern vertrauenswürdig

ISO Hergestellt in Deutschland trustpilot
Google-Bewertung

Erhalten Sie ein Angebot für die Supermicro GPU A+ Server AS-8126GS-NB3RT NVIDIA HGX B300 NVL8

Preise, Lieferzeiten und Hosting-Optionen. Persönliche Beratung durch unser Verkaufsteam.

Antwortet innerhalb von 24 Stunden via E-Mail, WhatsApp oder Anruf.

Produktdetails

Supermicro AS-8126GS-NB3RT HGX B300 NVL8: Blackwell Ultra im Detail, die 2,3TB Node Mathematics, Integriertes 800G Fabric und die Entscheidung gegen B200 und Rack-Scale-Systeme

Blackwell Ultra ist die erste GPU-Generation, die entwickelt wurde, nachdem die Industrie erkannt hat, was reasoning models zu bedienen kostet. Das B200 beantwortete die Trainingsfrage; das B300 beantwortet die darauf folgende Inference-Ära-Frage, und die Änderungen sind spezifisch statt kosmetisch. Diese Supermicro A+ Plattform ist der 8-GPU-Knoten, in dem diese Änderungen enthalten sind.

Der GPU-Komplex. Acht NVIDIA Blackwell Ultra B300 SXM GPUs sind auf das HGX B300 NVL8 Motherboard montiert, jede mit 288GB HBM3e, 60 Prozent mehr als das B200, was insgesamt 2.304GB im Knoten vereint. Fifth-generation NVLink verbindet jede GPU mit 1,8 TB/s über NVSwitch im Full Mesh. NVIDIA bewertet die dichte FP4-Durchsatzleistung des B300 mit 1,5-mal so viel wie das B200, ein Leistungsanstieg, der genau dort konzentriert ist, wo hochvolumiges Serving stattfindet, und die Micro-Tensor-Skalierung des zweiten Generation Transformer Engine ermöglicht die Produktionstauglichkeit bei vierbit Inference. Der Speicherbandbreite pro GPU bleibt in der Klasse von 8 TB/s; die Kapazität ist die Überschrift, denn Kapazität ist das, was reasoning workloads zuerst aufbrauchen.

Warum Kapazität die reasoning-Ära bestimmt. Ein Modell, das vor der Antwort denkt, generiert interne Tokens, und jeder von ihnen belegt KV Cache für die Dauer der Antwort. Lange reasoning-Spuren, erweiterte Kontextfenster und hohes Concurrency im Serving multiplizieren diese Fußspur. Auf kleineren Nodes führt das zu Offloading, Batch-Size-Reduktion oder beidem, und die Margen im Serving schrumpfen entsprechend. Ein 2,3TB-Knoten hält frontier-scale Gewichte und die gleichzeitig generierten Caches; das ist der Unterschied zwischen einem Modell, das passt, und einem Deployment, das sich rechnet.

Das integrierte Fabric und was es am Gehäuse verändert. Das HGX B300 NVL8 Motherboard trägt seine eigene Netzwerk-Infrastruktur: acht OSFP-Ports mit 800 Gb/s, jeweils einer pro GPU, doppelt so hoch wie die Rate der vorherigen Generation der Add-in-Adapter. Deshalb zeigt das Datenblatt nur zwei PCIe 5.0 Erweiterungssteckplätze, während B200-Systeme ein Dutzend hatten; die zwölf Slots waren für NICs gedacht, und diese NICs befinden sich nun auf dem Motherboard. Für Multi-Node-Deployments führt dies zu einem saubereren Aufbau, einem schnelleren Fabric und einer GPUDirect RDMA-Topologie, die durch Design garantiert wird, anstatt nach Bestellung zusammengebaut zu werden. Die beiden verbleibenden Slots dienen Speicher- und Managementnetzwerken.

Der Supermicro-Host. Dual AMD EPYC 9005 oder 9004 Serienprozessoren, bis zu 192 Kerne pro Sockel bei der 9005-Reihe, liefern die Vorverarbeitung, Tokenisierung und Datenladearbeiten, die acht GPUs dieser Klasse verlangen. Vierundzwanzig DDR5-Module mit 6400 MT/s sind je nach Kanal auf zwölf Kanäle pro Prozessor verteilt und skalieren auf 6TB, was das Full-Bandwidth-Layout hält, während sie weit über dem GPU-Pool sitzen, nach dem in diesem Katalog geschult wird; mit Raum nach oben. Acht Front-Hot-Swap E1.S NVMe-Bays speichern Datensätze on-node, und sechs 6600W Titanium-Hiore-Supply-Einheiten in redundanter Anordnung definieren eine Leistungsaufnahme, die klar sagt, was das ist: eine Data-Center-Maschine an der Spitze der air-cooled single-node Klasse.

Die Entscheidung gegen das HGX B200 in diesem Katalog. Das Gigabyte B200 Node liefert 1,4TB und die gleiche NVLink-Generation, und für Trainingsprogramme und Serving-Fleets, die innerhalb dieses Memory-Emfangs arbeiten, bleibt es die rationale Blackwell-Investition. Das B300 rechtfertigt seine Position in drei Fällen: reasoning- und long-context Inferenzen, bei denen KV-Cache-Tiefe die Batchgröße und damit die Wirtschaftlichkeit bestimmt, Deployments, die frontier-scale Modelle über 1,4TB hinaus bedienen, und Operatoren, die auf das integrierte 800G Fabric für Multi-Node-Wachstum setzen. Unterhalb dieser Schwellen gewinnt das B200 in der Wirtschaftlichkeit; bei diesen Schwellen ist das B300 der einzige Knoten, der passt.

Die Entscheidung gegen rack-scale. Über diesem Gerät stehen die GB200- und GB300-Klassensysteme, bei denen 72 GPUs unter Liquid Cooling und Gebäudetechnik eine NVLink-Domäne teilen. Die Grenze bleibt bestehen: Wenn Trainingsparallelisierung wirklich mehr als acht GPUs in einer einzigen kohärenten Domäne braucht, ist rack-scale die Lösung. Für alles, was acht Blackwell Ultra GPUs passt – was jetzt auch die Serving der größten eingesetzten Modelle einschließt – liefert dieser Knoten die Generation ohne Gebäudetechnik-Projekt und skaliert nach außen durch das integrierte 800G Fabric.

Exportkonformität und Bestellung. Blackwell-class Accelerators unterliegen US-Exportkontrollen, und MillionMiner bestätigt die Zielortberechtigung im Rahmen jedes Angebots. Jedes System wird nach Bestellung konfiguriert, getestet und weltweit DDP versandt, inklusive Zölle und Zollabwicklung. Deployment-Planung und Hosting in den eigenen Data Centers von MillionMiner sind für Teams verfügbar, die es vorziehen, das Rack-Power auf diesem Niveau vor Ort nicht selbst bereitzustellen.

Supermicro HGX B300 NVL8: Der Node für Modelle, die vor ihrer Antwort nachdenken

Die Inferenz-Ökonomie veränderte sich, als Modelle begannen zu reasoning. Eine chain-of-thought-Antwort verbraucht zehn bis einhundert Mal mehr Tokens als eine direkte Antwort, jeder reasoning-Trace amplifiziert den KV-Cache, und das profitabel bereitzustellen, wurde zu einem Speicher- und Präzisionsproblem. Blackwell Ultra ist NVIDIAs direkte Antwort, und diese Supermicro-Plattform ist die 8-GPU-Form, in der sie ausgeliefert wird.

Die Speicherantwort: 288GB HBM3e pro GPU, 60 Prozent mehr als die 180GB des B200, zusammengeschaltet auf 2,3TB im Knoten. Dieser Spielraum ist es, der Frontier-Modelle zusammen mit den langen KV-Caches trägt, die reasoning traces und erweiterte Context-Windows erzeugen, ohne das Offloading, das die Serving-Latenzzeiten ruiniert. Die Präzisionsantwort: NVIDIA bewertet das dichte FP4 des B300 mit dem 1,5-fachen des B200, die Durchsatzleistung zielt direkt auf Inferenz mit hohem Volumen ab, bei der four-bit Serving mit Micro-Tensor-Scaling die Genauigkeit erhält und die Kosten pro Token halbiert. Die Fabric-Antwort: Das HGX B300 NVL8 Baseboard integriert acht 800 Gb/s OSFP-Ports direkt, jeweils einer pro GPU mit doppelter Frequenz der vorherigen Generation, weshalb dieses Gehäuse nur zwei PCIe-Erweiterungssteckplätze benötigt, während B200-Systeme zwölf benötigten. Das Cluster-Netzwerk ist kein Add-on mehr, sondern Teil des GPU-Komplexes.

Supermicros Host hält die Proportionen richtig. Dual AMD EPYC 9005 oder 9004 Series Prozessoren erreichen 192 Kerne pro Sockel für preprocessing-intensive Pipelines, vierundzwanzig DDR5-Module bei 6400 MT/s skalieren auf 6TB, deutlich über dem 2,3TB GPU-Pool, und acht Front-Hot-Swap E1.S NVMe-Bays halten die Datensätze lokal. Sechs 6600W Titanium-Netzteile in redundanter Anordnung tragen das Gehäuse. Angeboten nach Konfiguration und weltweiter DDP-Lieferung durch MillionMiner.

Brauchen Sie Hilfe bei der Auswahl?

Unsere Mining-Spezialisten können Ihnen dabei helfen, den perfekten Miner für Ihre Ausstattung und Ihr Budget zu finden.

Supermicro HGX B300 NVL8: 2,3TB von Blackwell Ultra

Der größte einzelne Memory-Pool in diesem Katalog: acht NVIDIA Blackwell Ultra B300 SXM GPUs mit jeweils 288 GB HBM3e, 2,3 TB pro Node, verbunden durch fünfte Generation NVLink bei 1,8 TB/s pro GPU über NVSwitch. NVIDIA bewertet die dichte FP4 des B300 mit dem 1,5-fachen des B200, und das HGX B300 NVL8 Basboard integriert sein eigenes 800 Gb/s Fabric, acht OSFP-Ports, sodass kein Add-in-Card-Cluster erforderlich ist. Supermicro hostet es auf Dual AMD EPYC 9005 oder 9004 Prozessoren mit bis zu 6TB DDR5 6400, acht E1.S NVMe-Bays und sechs 6600W Titanium-Externeinheiten in 8U. Weltweit angeboten und versendet DDP von MillionMiner.

2,3TB HBM3e in einem Knoten

Eight Blackwell Ultra B300 SXM GPUs mit 288GB each, 60 Prozent mehr als B200. Frontier Gewichte und Reasoning-Scale KV-Caches passen zusammen.

Für die Ära des Reasonings gebaut

NVIDIA bewertet dense FP4 mit 1,5-mal dem B200. Chain-of-thought-Dienste, langer Kontext und hohe Parallelität sind das, was dieser Knoten richtig bepreist.

800G Fabric auf dem Baseboard

Acht integrierte OSFP-Ports mit 800 Gb/s, jeweils eines pro GPU. Das Clustering ist integriert und nicht nachträglich hinzugefügt, und das Fabric läuft mit doppelt so hoher Geschwindigkeit wie vorher.

Häufig gestellte Fragen

Häufig gestellte Fragen

HGX B300 NVL8 ist NVIDIA's 8-GPU Blackwell Ultra Baustein: acht B300 SXM GPUs, das NVSwitch-Gewebe, das sie jeweils mit 1,8 TB/s verbindet, und integrierte 800 Gb/s Netzwerkports, die an Hersteller wie Supermicro geliefert werden. Im Vergleich zum B200 steigt der Speicher um 60 Prozent auf 288GB HBM3e pro GPU, NVIDIA bewertet den dichten FP4-Durchsatz mit dem 1,5-fachen, und die Fabric-Ports verdoppeln sich auf 800 Gb/s, während sie auf das Mainboard selbst übertragen werden.

2.304 GB gepooltes HBM3e über acht GPUs, fünfte Generation NVLink mit 1,8 TB/s pro GPU über NVSwitch, dichter FP4-Durchsatz, den NVIDIA mit dem 1,5-fachen des HGX B200 angibt, und acht integrierte Fabric-Ports mit 800 Gb/s. In Bezug auf die Arbeitslast: frontier-scale Modelle bieten vollumfänglichen KV-Cache-Spielraum, Modelle mit Hunderten von Milliarden Parametern werden in voller Präzision auf einem Knoten feinjustiert, und Reasoning-Flotten halten Batch-Größen, bei denen kleinere Speichere pools kollabieren.

Denn sie multiplizieren die Token-Anzahl. Ein Modell, das vor dem Antworten überlegt, erzeugt interne Gedankengänge, von denen jeder Token den KV-Cache für die Dauer der Antwort belegt, und lange Kontexte sowie hohe Parallelität vervielfachen den Fußabdruck weiter. Wenn der Cache den GPU-Speicher erschöpft, fällt die Auslieferung auf Auslagerung oder kleinere Chargen zurück, und die Wirtschaftlichkeit sinkt accordingly. Die 288GB pro GPU des B300 existieren, um Gewichte und reasoning-scale Caches gleichzeitig zu halten, und seine dichte FP4-Steigerung reduziert die Kosten für jeden dieser zusätzlichen Token.

Drei Situationen. Inferenz-Flotten, die reasoning- oder Langzeit-Kontext-Arbeitslasten bedienen, bei denen die KV-Cache-Tiefe die Batchgröße und den Margin festlegt. Modelle, die über den 1,4TB-Knoten des B200 hinausgehen. Und Betreiber, die auf integrierte 800G-Fabrics für Multi-Node-Wachstum standardisieren. Trainingsprogramme und Servierungsflotten, die bequem innerhalb von 1,4TB arbeiten, werden in der Regel besser vom Gigabyte HGX B200 System bedient, und MillionMiner-Modelle sind in beiden Angeboten enthalten.

Da das Networking auf das GPU-Baseboard umgezogen ist. B200-Klassen-Systeme hatten ein Dutzend Slots, hauptsächlich um je eine 400 Gb/s-Adapter pro GPU zu beherbergen; das HGX B300 NVL8 integriert direkt acht 800 Gb/s OSFP-Ports, sodass die für GPUDirect RDMA gewünschte Ein-Port-pro-GPU-Topologie mit doppelt so hoher Geschwindigkeit integriert ist. Die beiden verbleibenden PCIe 5.0 Slots sind für Storage und Management-Netzwerke reserviert, was alles ist, was noch hinzugefügt werden kann.

Dual AMD EPYC 9005 oder 9004 Serie Prozessoren, die bis zu 192 Kerne pro Sockel bei der 9005-Reihe erreichen, mit vierundzwanzig DDR5-Modulen bei 6400 MT/s, eins pro Kanal für volle Bandbreite und Skalierung auf 6TB, weit über dem 2,3TB GPU-Pool. Der Speicher umfasst acht frontseitige Hot-Swap E1.S NVMe Bays für lokale Datensätze. Die Proportionen folgen den Größenregeln, die der Rest dieses Katalogs lehrt, mit Spielraum.

Die Grenze ist das NVLink-Domain. Dieser Knoten verbindet acht GPUs in einem kohärenten Fabric auf luftfähiger Infrastruktur; rack-scale-Systeme verbinden 72 GPUs unter Wasserkühlung und einem Anlagenengineering-Projekt. Wenn Trainingsparallelität wirklich mehr als acht GPUs in einem Domain benötigt, ist rack-scale die Lösung. Für die Bereitstellung sogar der größten eingesetzten Modelle und für das Training, das auf acht Blackwell Ultra GPUs passt, liefert dieser Knoten die Generation ohne den Anlagenaufwand und erweitert sich nach außen über sein integriertes 800G Fabric.

Über das eigene Fabrik des Motherboards: acht 800 Gb/s OSFP-Ports, einer pro GPU, die GPUDirect RDMA ausführen, sodass Gradienten und Aktivierungen zwischen Knoten übertragen werden, ohne die CPU zu berühren. Die Topologie, die B200-Ära-Systeme aus Add-in-Karten zusammengestellt haben, wird hier absichtlich verwendet. MillionMiner berät bei Switch- und Fabric-Architektur, wenn eine Deployment die Grenze von einer Maschine überschreitet.

Sechs 6600W Titanium-Level redundante Stromversorgungen bestimmen den Rahmen, der dieses Gerät an die Spitze der luftverwendbaren Einzelknotenklasse stellt und eindeutig im Bereich der Rechenzentren positioniert. MillionMiner bestätigt während des Angebots den genauen Stromverbrauch und den thermischen Plan Ihrer spezifizierten Konfiguration, und das Hosting in den eigenen Einrichtungen von MillionMiner ist für Teams verfügbar, die es vorziehen, die Rack-Leistung nicht in diesem Umfang bereitzustellen.

Reichen Sie Ihre Arbeitsbelastung, Skalierungs- und Bereitstellungsdetails über das Angebotsformular ein. Ein MillionMiner-Spezialist bestätigt die Konfiguration, die Eignung des Zielorts im Rahmen der US-Exportkontrollen, die für Blackwell-Klassen-Acceleratoren gelten, sowie den Lieferplan. Jedes System wird vor dem Versand getestet und weltweit DDP geliefert, inklusive Zollabwicklung. Rack-Integrationsanleitung und gehostete Bereitstellung sind ebenfalls verfügbar.