Gigabyte

GIGABYTE G893-ZD1-AAX5 HGX B200 8-GPU Server

Modello: G893-ZD1-AAX5

Piattaforma Gigabyte 8U per la scheda base NVIDIA HGX B200: otto GPU Blackwell B200 SXM con 180GB di HBM3e ciascuno, 1,4TB e 64 TB/s di memoria per nodo, collegati tramite NVLink di quinta generazione a 1,8 TB/s per GPU attraverso NVSwitch. Due processori AMD EPYC 9005 o 9004, ventiquattro moduli DDR5, otto baie NVMe Gen5 e dodici alimentatori Titanium da 3000W in configurazione ridondante 6+6 supportano questa soluzione, raffreddata ad aria. La frontiera Blackwell attuale per l'AI a singolo nodo, quotata e spedita in tutto il mondo DDP da MillionMiner.

Richiedi il tuo preventivo per il server

Fateci sapere il vostro carico di lavoro e le vostre esigenze di implementazione. Il nostro specialista risponde entro 24 ore tramite email, WhatsApp o una telefonata.

Perché questo server è quotato su ordinazione

Questi server sono configurati e quotati su richiesta. La tua configurazione, archiviazione, rete, garanzia e integrazione nel rack determinano il prezzo finale, e la tua destinazione di consegna stabilisce le spese di spedizione e doganali. Compila il modulo sottostante e il nostro specialista risponderà entro 24 ore con un preventivo completo che include hardware, garanzia e consegna DDP in tutto il mondo.

Come funziona il tuo ordine del server

1

Invia modulo

Condividi dettagli sul carico di lavoro e sull'implementazione

2

Ottieni il tuo preventivo

Prezzi completi entro 24 ore

3

Recensione con uno specialista

Finalizza la configurazione e la consegna

4

Consegna

Spedito e pronto per l'implementazione

Autentico

Hardware testato

In tutto il mondo

Spedizione globale

Supporto

Esperti di Mining

Specifiche complete

Modello G893-ZD1-AAX5
Formato fisico 8U Rackmount
Raffreddamento Air
GPU 8x NVIDIA B200 SXM (180GB HBM3e each)
Memoria totale GPU 1.4TB HBM3e (8x 180GB)
Larghezza di banda della memoria 64 TB/s aggregate
Interconnessione NVIDIA NVLink 5 and NVSwitch, 1.8 TB/s per GPU
Processori Dual AMD EPYC™ 9005/9004 Series
DIMMs 24x DDR5 RDIMM (one per channel for full bandwidth)
Reti Up to 400 Gb/s per GPU (Quantum-2 InfiniBand / Spectrum-X)
Archiviazione 8x 2.5" Gen5 NVMe hot-swap bays
Slot PCIe 4x FHHL dual-slot, 8x FHHL single-slot
Alimentatore 12x 3000W 80 PLUS Titanium (6+6 redundant)

Richiedi un preventivo per il hosting di un Bitcoin Miner

Preventivo gratuito, risposta entro 24 ore. Nessuna chiamata di vendita.

4.4
stella stella stella stella stella

4,7 / 5 su Trustpilot

Recensioni verificate dai clienti

Oltre 30.000 miner consegnati

Spedito in tutto il mondo dal 2020

1.200+ clienti in tutto il mondo

Affidabile in oltre 50 paesi

ISO Prodotto in Germania trustpilot
recensione-google

Ottieni un preventivo per il GIGABYTE G893-ZD1-AAX5 HGX B200 8-GPU Server

Prezzi, tempi di consegna e opzioni di hosting. Consigli personalizzati dal nostro team di vendita.

Rispondi entro 24h tramite email, WhatsApp o una chiamata.

Dettagli del prodotto

Gigabyte HGX B200 Server 8-GPU: Architettura Blackwell in Dettaglio, Matematica a Livello Nodo, la Decisione tra B200 e H200, e Dove Prendono il Sopravvento i Sistemi a Scala Rack

Ogni generazione di GPU viene venduta come una rivoluzione. Il modo preciso per valutare Blackwell è separare i cambiamenti fisici dai moltiplicatori di marketing, e questo server premia questo esercizio, perché i cambiamenti fisici sono sostanziali.

La GPU stessa. Ogni NVIDIA B200 è un package dual-die: due die, ognuno al limite di produzione del reticolo, collegati da un'interfaccia die-to-die a 10 TB/s e presentati al software come una singola GPU con 208 miliardi di transistor. Ognuno contiene 180GB di HBM3e a circa 8 TB/s di bandwidth, contro 141GB a 4.8 TB/s sull'H200. Il secondo generation Transformer Engine estende la scala di precisione fino a FP4 con micro-tensor scaling, hardware che traccia la scala di quantizzazione a gran granularità in modo che l'inferenza a quattro bit mantenga l'accuratezza che la quantizzazione naive precedente aveva perso. Il NVLink di quinta generazione raddoppia il fabric a 1.8 TB/s per GPU.

La matematica del nodo. Otto GPU B200 SXM sulla scheda di base HGX aggregano 1.440GB di HBM3e, 64 TB/s di bandwidth totale di memoria, e 144 petaFLOP di calcolo FP4, con NVSwitch che collega ogni GPU a tutte le altre a piena velocità NVLink, 14.4 TB/s di fabric complessivo. In termini di workload: modelli con centinaia di miliardi di parametri si perfezionano a piena precisione all’interno di un nodo, modelli di trilioni di parametri operano in tempo reale su un nodo con FP4, inferenza a lungo contesto con headroom per KV cache che nessun nodo Hopper raggiunge, e architetture Mixture-of-Experts che si muovono tra esperti su un fabric due volte più veloce rispetto alla generazione H200. I confronti pubblicati da NVIDIA, fino a 15x di inferenza in tempo reale con trilioni di parametri e circa 3x di training rispetto alla generazione H100, sono dati del fornitore, ma i delta hardware che li guidano non lo sono.

La piattaforma Gigabyte. L'host consiste in dual AMD EPYC 9005 o 9004, raggiungendo 192 core per socket sulla linea 9005, importante per il tokenization, augmentation e data-loading che alimentano otto GPU di questa classe. Ventiquattro moduli DDR5 popolano uno per canale su dodici canali per processore, la configurazione che mantiene piena bandwidth di memoria piuttosto che comprometterla a favore della capacità. Lo storage utilizza otto bay hot-swap Gen5 NVMe per dataset locali. La disposizione PCIe è pensata per il clustering: otto slot singoli ospitano ciascuno un adattatore da 400 Gb/s per GPU, la topologia one-to-one richiesta da GPUDirect RDMA, su NVIDIA Quantum-2 InfiniBand o Spectrum-X Ethernet, con quattro ulteriori slot doppi per storage e networking di gestione. L’alimentazione consiste in dodici alimentatori da 3000W 80 PLUS Titanium in configurazione ridondante 6+6, e il design termico muove l’intero complesso GPU su aria, mantenendo l’installazione in data center ordinari anziché in quelli predisposti per il liquido.

La decisione contro i sistemi H200 in questo catalogo. Le piattaforme Lenovo e ASUS HGX H200 offrono 1.1TB per nodo su un fabric a 900 GB/s, e per team che perfezionano modelli di classe 70B o operano entro quell’ombrello di memoria, rimangono l’acquisto più razionale. Il nodo B200 giustifica il suo premium in tre situazioni: flotte di inferenza che servono modelli a scala frontier dove FP4 raddoppia i token per watt, run di training con fabric raddoppiata e aumento del 60% della bandwidth che comprimono i tempi di progetto di business, e workload già al limite della memoria del H200. Sotto queste soglie, vince l’economia Hopper; a queste soglie, vince Blackwell.

La decisione contro Blackwell a scala rack. Sopra questa macchina si trova la classe NVIDIA DGX GB200, dove 72 GPU condividono un dominio NVLink a scala rack. Il limite è il dominio NVLink stesso: se il tuo parallelismo di training necessita di più di otto GPU in un unico fabric coerente, la scala rack è la risposta, e porta raffreddamento liquido, ingegneria delle strutture e un diverso livello di impegno. Per tutto quello che si adatta a otto GPU Blackwell, che include la maggioranza del training enterprise e quasi tutta l’inferenza in servizio, questo nodo consegna la stessa generazione senza il progetto infrastrutturale.

Conformità all’esportazione e ordini. Gli acceleratori Blackwell-class sono soggetti ai controlli di esportazione US, e MillionMiner conferma l’idoneità a destinazione come parte di ogni preventivo. Ogni sistema è configurato su misura, testato e spedito in tutto il mondo DDP con dazi e dogane gestiti. La pianificazione del deployment e l’hosting nei data center di MillionMiner sono disponibili per team che preferiscono non approvvigionarsi di alimentazione rack su questa scala in loco.

Server Gigabyte HGX B200: Cosa Cambia Davvero Quando Passi a Blackwell

Il marketing generazionale è rumoroso, quindi ecco il passo di Blackwell esposto sotto forma di numeri. Per GPU, la memoria aumenta da 141GB dell'H200 a 180GB di HBM3e, e la bandwidth da 4,8 a circa 8 TB/s, con un guadagno del 60 percento. La fabric NVLink raddoppia, 1,8 TB/s per GPU contro 900 GB/s, tramite NVSwitch in full mesh. Per nodo, ciò si traduce in 1,4TB di memoria GPU poolsata, 64 TB/s di bandwidth aggregata e 144 petaFLOPS di calcolo FP4. Ogni B200 è un design dual-die, con due die a limite reticolo uniti a 10 TB/s e presentati come una singola GPU con 208 miliardi di transistors.

La storia della precisione è importante tanto quanto la bandwidth. Il secondo generazione di Transformer Engine di Blackwell introduce FP4 con micro-tensor scaling, che trasforma i modelli di trillion-parameter da problemi di cluster a problemi di nodo per l'inferenza. Le cifre pubblicate da NVIDIA collocano l'inferenza in tempo reale dell'HGX B200 fino a 15 volte superiore rispetto alla generazione H100 sui workload di trillion-parameter, con l'energia per token che diminuisce di conseguenza. Per l'addestramento, NVIDIA cita circa 3 volte la generazione H100. Questi sono benchmark del fornitore e vanno interpretati come tali, ma le modifiche architetturali dietro di essi, FP4, fabric raddoppiata, 60 percento in più di bandwidth di memoria, sono fatti fisici.

La piattaforma host di Gigabyte tiene il passo. Due processori AMD EPYC 9005 o 9004 serie raggiungono 192 core per socket per pipeline con carico pesante di preprocessing, con ventiquattro moduli DDR5 che popolano un modulo per canale su dodici canali per processore, il layout che garantisce tutta la bandwidth di memoria. Otto bays NVMe Gen5 mantengono i dataset locali, otto posizioni PCIe a singolo slot ospitano un adattatore da 400 Gb/s per Quantum-2 InfiniBand o clustering Spectrum-X, e dodici alimentatori Titanium da 3000W in configurazione ridondante 6+6 assicurano affidabilità, con raffreddamento ad aria. Quotati per configurazione e spediti in tutto il mondo DDP da MillionMiner.

Hai bisogno di aiuto nella scelta?

I nostri specialisti in mining possono aiutarti a trovare il miner perfetto per la tua configurazione e il tuo budget.

Gigabyte HGX B200: 1,4TB di Blackwell per Nodo, in aria

Questa è la categoria Blackwell: otto NVIDIA B200 SXM GPUs sulla scheda base HGX, ciascuna con 180GB di HBM3e, che pooled 1.4TB di memoria GPU e 64 TB/s di bandwidth in un singolo nodo. Fifth-generation NVLink collega ogni GPU a 1.8 TB/s attraverso NVSwitch, il doppio del fabric H200, e il secondo-generation Transformer Engine aggiunge la precision FP4 che NVIDIA cita fino a 15x di inference in tempo reale per modelli trillion-parameter contro la generazione H100. Gigabyte lo ospita su due processori AMD EPYC 9005 o 9004 con ventiquattro moduli DDR5, otto baie NVMe Gen5 e dodici alimentatori Titanium da 3000W, raffreddati ad aria. Quoted e spediti in tutto il mondo DDP da MillionMiner.

1.4TB HBM3e, 64 TB/s, One Node

Otto GPU B200 SXM da 180GB ciascuno su NVSwitch. L'inferenza di classe trilione di parametri diventa un acquisto monocavo, raffreddato ad aria.

FP4: La leva di inferenza di Blackwell

Seconda generazione di Transformer Engine con scaling micro-tensor. NVIDIA cita fino a 15x inferenza in tempo reale rispetto alla generazione H100.

Doppia la struttura dell'H200

NVLink di quinta generazione a 1,8 TB/s per GPU, 14,4 TB/s attraverso il nodo. Sincronizzazione dei gradienti e routing MoE a doppia banda di Hopper.

Domande frequenti

Domande frequenti

HGX B200 è il modulo di NVIDIA con 8-GPU Blackwell: otto GPU B200 SXM e la rete NVSwitch che li collega, forniti ai produttori come Gigabyte che progettano server completi attorno ad esso. Le modifiche rispetto a Hopper: ogni B200 è un package dual-die con 208 miliardi di transistor, la memoria sale a 180GB di HBM3e per GPU a circa 8 TB/s, NVLink raddoppia a 1.8 TB/s per GPU, e il Transformer Engine di seconda generazione aggiunge la precisione FP4 con micro-scalatura di tensor.

1.440 GB di pooled HBM3e, 64 TB/s di bandwidth di memoria aggregata, 144 petaFLOPS di calcolo FP4 e 14.4 TB/s di fabric NVLink tramite NVSwitch. In termini di carico di lavoro: ottimizzazione con precisione completa di modelli con alcune centinaia di miliardi di parametri, servizio in tempo reale FP4 di modelli di classe trilione di parametri e inferenza con contesto lungo con spazio KV cache superiore a qualsiasi nodo Hopper.

Tre situazioni. Flotte di inferenza alla frontiera, dove FP4 raddoppia approssimativamente i token per watt e NVIDIA cita fino a 15x di inferenza in tempo reale con trillion-parameter contro la generazione H100. Programmi di training in cui il fabric raddoppiato e il guadagno del 60 percento di banda comprimono le tempistiche con valore aziendale. E carichi di lavoro che già sfiorano il limite di 141GB per-GPU dell'H200. I team che raffinano modelli della classe 70B o che servono all’interno dell’envelope Hopper sono generalmente meglio serviti dai sistemi Lenovo o ASUS HGX H200, e MillionMiner modellerà entrambi nel preventivo.

Utilizzabile, con ingegneria. Il Transformer Engine di seconda generazione implementa il micro-tensor scaling, tracciando la scala di quantizzazione a granularità fine in modo che i pesi a quattro bit mantengano un'accuratezza che la quantizzazione naive perde. Le stack di servizio in produzione, tra cui TensorRT-LLM, lo supportano, e l'inferenza di grandi modelli è il vero vantaggio: l'impronta di memoria si dimezza rispetto a FP8 e il throughput raddoppia grossolanamente. L'addestramento continua a utilizzare FP8 e BF16; FP4 è un leva economica per l'inferenza, e di grande impatto su scala flottante.

Sì, questa è la premessa ingegneristica di questa piattaforma Gigabyte: un chassis 8U con il volume di flusso d'aria sufficiente a contenere l'intero complesso HGX B200 alle specifiche senza raffreddamento liquido diretto. La conseguenza pratica è la libertà di deployment, poiché non sono necessari distribuzione del coolant, impianti idraulici o manutenzione del ciclo liquido e qualsiasi data center con energia adeguata e raffreddamento convenzionale è idoneo. MillionMiner conferma i requisiti di flusso d'aria e temperatura di ingresso per il tuo sito durante il preventivo.

Densità del core e larghezza di banda della memoria. La serie EPYC 9005 raggiunge 192 core per socket, che alimentano pipeline con preprocessing intensivo per otto GPU di questa classe, e la piattaforma gestisce dodici canali DDR5 per processore con i ventiquattro moduli popolati uno per canale, l’organizzazione che sostiene tutta la larghezza di banda. Il budget di linee PCIe Gen5 supporta anche la topologia di rete one-adapter-per-GPU senza compromessi. La serie 9004 rimane disponibile per i team standardizzati su di essa.

Il confine è il dominio NVLink. Questo nodo collega otto GPU in un unico tessuto coerente; la classe GB200 collega 72 a livello rack, con raffreddamento a liquido e ingegneria delle strutture per adattarsi. Se il tuo parallelismo di addestramento necessita realmente di più di otto GPU in un singolo dominio, la soluzione è a livello rack. Per tutto ciò che si adatta a otto GPU Blackwell, che copre la maggior parte dell'addestramento aziendale e quasi tutto il servizio di inferenza, questo nodo offre la stessa generazione senza il progetto di struttura, e si espande invece oltre tramite InfiniBand.

Attraverso la topologia one-adapter-per-GPU, la disposizione PCIe è strutturata per: otto posizioni a rack singolo ospitano adattatori da 400 Gb/s su NVIDIA Quantum-2 InfiniBand o Spectrum-X Ethernet, offrendo a GPUDirect RDMA una porta dedicata sulla rete per GPU, così i gradienti si spostano tra i nodi senza coinvolgere la CPU. Quattro posizioni aggiuntive a doppio slot supportano la rete di archiviazione e gestione. MillionMiner consiglia sulla progettazione di switch e fabric quando una distribuzione supera una macchina.

Dodici alimentatori 3000W 80 PLUS Titanium in configurazione ridondante 6+6 definiscono il limite, con il complesso GPU in grado di assorbire da solo otto kilowatt sotto carico sostenuto prima di considerare il host. Questa è decisamente una macchina da data center. MillionMiner conferma il consumo esatto della configurazione specificata durante il preventivo, e il hosting nelle strutture di MillionMiner è disponibile per i team che preferiscono non provisioningare l'alimentazione del rack su questa scala.

Invia i dettagli del tuo carico di lavoro, scalabilità e distribuzione tramite il modulo di richiesta preventivo. Un esperto di MillionMiner conferma la configurazione, l'ammissibilità della destinazione secondo le normative US sull'esportazione che si applicano agli acceleratori Blackwell-class e il piano di consegna. Ogni sistema viene testato prima della spedizione e consegnato in tutto il mondo DDP con dogane e dazi gestiti. Sono disponibili anche linee guida per l'integrazione nel rack e la distribuzione ospitata.