NVIDIA

NVIDIA DGX A100 Deep Learning System (8x A100, 640GB)

Modello: DGX A100

L'appliance AI original costruito da NVIDIA: otto GPU A100 80GB SXM4 su sei NVSwitches con 640GB di memoria GPU unificata, dual CPU AMD EPYC a 64 core, fino a 2TB di memoria di sistema e 30TB di storage NVMe Gen4, consegnato come un sistema integrato in fabbrica che esegue l'intera suite software DGX di NVIDIA. Infrastruttura di training turnkey con responsabilità di fornitore unico, fornita e spedita in tutto il mondo DDP da MillionMiner.

Richiedi il tuo preventivo per il server

Fateci sapere il vostro carico di lavoro e le vostre esigenze di implementazione. Il nostro specialista risponde entro 24 ore tramite email, WhatsApp o una telefonata.

Perché questo server è quotato su ordinazione

Questi server sono configurati e quotati su richiesta. La tua configurazione, archiviazione, rete, garanzia e integrazione nel rack determinano il prezzo finale, e la tua destinazione di consegna stabilisce le spese di spedizione e doganali. Compila il modulo sottostante e il nostro specialista risponderà entro 24 ore con un preventivo completo che include hardware, garanzia e consegna DDP in tutto il mondo.

Come funziona il tuo ordine del server

1

Invia modulo

Condividi dettagli sul carico di lavoro e sull'implementazione

2

Ottieni il tuo preventivo

Prezzi completi entro 24 ore

3

Recensione con uno specialista

Finalizza la configurazione e la consegna

4

Consegna

Spedito e pronto per l'implementazione

Autentico

Hardware testato

In tutto il mondo

Spedizione globale

Supporto

Esperti di Mining

Specifiche complete

Modello DGX A100
GPU 8x NVIDIA A100
Memoria totale GPU Up to 640 GB
NVLinks per GPU 12
Larghezza di banda bidirezionale 600 GB/s
NVSwitches 6x NVIDIA NVSwitch
Prestazioni dell'IA 5 petaFLOPS
MIG Up to 56 instances (7 per GPU)
Memoria di sistema Up to 2 TB
CPU Dual 64-core AMD
Archiviazione Up to 30 TB Gen4 NVMe SSD
Interfaccia di Rete 10x Mellanox ConnectX-6
Sistema operativo Ubuntu Linux

Richiedi un preventivo per il hosting di un Bitcoin Miner

Preventivo gratuito, risposta entro 24 ore. Nessuna chiamata di vendita.

4.4
stella stella stella stella stella

4,7 / 5 su Trustpilot

Recensioni verificate dai clienti

Oltre 30.000 miner consegnati

Spedito in tutto il mondo dal 2020

1.200+ clienti in tutto il mondo

Affidabile in oltre 50 paesi

ISO Prodotto in Germania trustpilot
recensione-google

Ottieni un preventivo per il NVIDIA DGX A100 Deep Learning System (8x A100, 640GB)

Prezzi, tempi di consegna e opzioni di hosting. Consigli personalizzati dal nostro team di vendita.

Rispondi entro 24h tramite email, WhatsApp o una chiamata.

Dettagli del prodotto

Sistema di Deep Learning NVIDIA DGX A100: Architettura, Stack Software, Scaling SuperPOD e la Decisione tra Costruire o Acquistare per un'infrastruttura AI con 8 GPU

Il DGX A100 occupa un posto specifico nella storia dell'infrastruttura AI: è la macchina che ha definito l'aspetto di un nodo di formazione a 8-GPU. Ogni server HGX A100 sul mercato, comprese le piattaforme Supermicro presenti nel catalogo di MillionMiner, è costruito attorno alla scheda base GPU NVIDIA progettata per questo sistema. Acquistare il DGX significa acquistare l'originale, con tutto ciò che NVIDIA sovrappone sopra il silicio.

L'architettura di calcolo. Otto GPU NVIDIA A100 80GB SXM4 sono montate sulla scheda base HGX e interconnesse tramite sei NVSwitch in una topologia full-mesh. Ogni GPU dispone di 12 NVLinks di terza generazione, offrendo 600 GB/s di bandwidth bidirezionale GPU-GPU, con 4.8 TB/s di bandwidth di sezione trasversale aggregata attraverso il fabric. In termini pratici, la sincronizzazione dei gradienti tra tutte e otto le GPU si completa abbastanza rapidamente da permettere uno scaling del training distribuito vicino a lineare, che è l'intera ragione per cui esistono sistemi SXM più NVSwitch. Il nodo totalizza 640GB di memoria GPU pooled HBM2e e 5 petaFLOPS di performance AI, con una throughput di inferenza INT8 che raggiunge i 10 petaOPS. Le partizioni Multi-Instance GPU dividono ciascuna A100 in fino a sette istanze isolate, così un DGX può presentare fino a 56 GPU partizionate hardware per inferenza multi-tenant, configurazione che permette alla stessa macchina di allenarsi di notte e di servire decine di workload isolati di giorno.

La piattaforma host è dimensionata affinché le GPU non aspettino mai. Due processori AMD EPYC 7742 a 64-core forniscono 128 core e 256 thread per il caricamento dati, preprocessing e augmentation. La memoria di sistema raggiunge 2TB di DDR4. Lo storage si divide tra M.2 NVMe dedicati per il sistema operativo e 30TB di NVMe Gen4 interni per dataset, mantenendo gli I/O di training lontani dal percorso di boot. Dieci interfacce Mellanox ConnectX-6 includono otto adattatori HDR InfiniBand a singolo porta da 200Gb/s, disposti uno per GPU per GPUDirect RDMA, la topologia che permette a più nodi DGX di scambiare gradienti direttamente tra le memorie GPU attraverso la rete senza coinvolgere la CPU.

Lo stack software, che rappresenta la metà di ciò che i server white-box non includono. DGX OS, una distribuzione basata su Ubuntu ottimizzata per l’hardware, è installato di default. NVIDIA Base Command fornisce orchestrazione, scheduling e gestione della flotta. Il catalogo NGC fornisce container certificati per ogni grande framework di training e inferenza, validati in termini di prestazioni su questo sistema esatto, così il gap tra la ricezione e la prima sessione di training si misura in ore. Il supporto NVIDIA AI Enterprise copre l'intero stack sotto un unico contratto: quando un lavoro fallisce, non ci sono integratori che indicano NVIDIA e NVIDIA che indica a loro.

Il percorso di scaling è parte di ciò che si acquista. Il DGX A100 è il modulo di base dell'architettura di riferimento NVIDIA DGX SuperPOD, il blueprint pubblicato per scalare da un nodo a cluster di venti, cento o più, con topologia di rete, architettura di storage e strumenti di gestione validati. Le organizzazioni che iniziano con un DGX erediteranno un percorso documentato, dal tuning singolo nodo fino all'addestramento su scala cluster, piuttosto che doverlo progettare autonomamente.

La decisione di build-versus-buy, dichiarata onestamente. MillionMiner vende entrambe le opzioni. L’AS-4124GO-NART+ di Supermicro in questo catalogo offre lo stesso complesso GPU NVSwitch a otto A100 su un host configurabile a un costo inferiore, e per team con budget che preferiscono gestire personalmente integrazione e stack software, è la scelta razionale. Il DGX A100 è per l’acquirente opposto: aziende e istituti di ricerca dove l’approvvigionamento favorisce la responsabilità da parte di un singolo vendor, dove la conformità richiede una piattaforma di riferimento supportata, e dove il costo di ingegneri che debugano problemi di integrazione supera il sovrapprezzo dell’apparecchio. Primo run di training, un’unica corda da stringere e un percorso di scaling validato sono il prodotto.

Il DGX A100 resta l'appliance AI più ampiamente distribuita di sempre, con un ecosistema software che NVIDIA continua a mantenere attraverso le attuali release di CUDA. Come sistema rackmount 6U che consuma diversi kilowatt a pieno carico, appartiene all’ambiente dei data center; MillionMiner conferma i requisiti di energia e raffreddamento durante la configurazione, spedisce in tutto il mondo DDP con la dogana gestita, e offre hosting nelle proprie strutture per team che preferiscono non provisioningare infrastrutture in loco.

NVIDIA DGX A100: Perché le squadre preferiscono pagare per l'appliance invece di costruire il server

Ogni integratore competente può montare otto GPU A100 in un chassis. Quello che non può consegnare è il resto del DGX A100: il sistema che NVIDIA ha progettato intorno alla propria scheda madre HGX, validato come unitaria e supportato da un solo fornitore per tutto ciò che è all’interno del box.

L’hardware rappresenta il progetto di riferimento che ogni server con otto GPU A100 imita. Otto GPU A100 80GB SXM4 si interconnettono tramite sei NVSwitch, ogni GPU supporta 12 NVLinks per 600 GB/s di banda bidirezionale e 4,8 TB/s di throughput aggregato sulla rete, il doppio della generazione DGX precedente. Il nodo mette a disposizione 640GB di memoria GPU e garantisce 5 petaFLOPS di performance AI. Due processori AMD EPYC a 64-core, fino a 2TB di memoria di sistema DDR4, 30TB di NVMe Gen4 interna e dieci interfacce Mellanox ConnectX-6 (otto a 200Gb/s per la rete di calcolo, le altre per storage e gestione) completano un sistema di cui non manca nessun componente da specificare, acquistare o debugare.

Il software è ciò che le alternative white-box non possono eguagliare. DGX OS arriva già installato e ottimizzato. NVIDIA Base Command gestisce l’orchestrazione, la pianificazione dei job e la gestione del cluster. Il catalogo NGC fornisce container certificati e ottimizzati per le prestazioni di PyTorch, TensorFlow, RAPIDS, Triton e centinaia di altri framework, testati specificamente per l’hardware DGX. Quando qualcosa si comporta male in qualsiasi parte della pila — GPU, rete, driver o container — un unico contratto di supporto con un solo fornitore trova la soluzione.

Questa è la logica di acquisto. Il DGX A100 è pensato per team il cui costo di rischio di integrazione, tempo di debug e ritardo nelle sessioni di training supera il premio dell’apparecchio. MillionMiner fornisce il DGX A100 con consegna DDP in tutto il mondo e supporta la pianificazione del deployment, l’integrazione in rack e l’hosting.

Hai bisogno di aiuto nella scelta?

I nostri specialisti in mining possono aiutarti a trovare il miner perfetto per la tua configurazione e il tuo budget.

NVIDIA DGX A100: L'appliance AI all-in-one con 8 GPU

Il DGX A100 è il sistema 8-GPU di NVIDIA, costruito, integrato e supportato end-to-end dall'azienda che produce le GPU. Ottava GPU A100 80GB SXM4 si collega tramite sei NVSwitch con 12 NVLinks per GPU a 600 GB/s, accorpando 640GB di memoria GPU dietro 5 petaFLOPS di prestazioni AI. Due CPU AMD EPYC da 64-core, fino a 2TB di memoria di sistema, 30TB di storage NVMe Gen4 e dieci interfacce Mellanox ConnectX-6 sono pre-integrate, con DGX OS e stack software certificato NVIDIA installati prima della spedizione. Accendilo, tira fuori un container da NGC e inizia l'addestramento lo stesso giorno.

L'Originale 8x A100 Appliance

Otto GPU A100 80GB, sei NVSwitches, 640GB di memoria aggregata, 5 petaFLOPS. Il sistema di riferimento rispetto al quale vengono misurati ogni server HGX A100.

Software Incluso, Rischio Escluso

DGX OS, Base Command e contenitori certificati NGC arrivano già installati. Un fornitore supporta l'intera stack dal silicon GPU al framework.

Un Node oggi, SuperPOD domani

Otto porte fabric ConnectX-6 da 200Gb/s e l'architettura SuperPOD pubblicata da NVIDIA ti offrono un percorso convalidato da un sistema a un cluster di training.

Domande frequenti

Domande frequenti

Il complesso hardware GPU è simile nel design, poiché altri fornitori si basano sulla scheda madre HGX di NVIDIA. La differenza sta in tutto ciò che lo circonda: ingegneri NVIDIA, validazione e supporto del sistema completo come un unico prodotto, con DGX OS, orchestrazione Base Command e container certificati NGC preinstallati. I server white-box lasciano a te l'integrazione, l'ottimizzazione dell'OS e la coordinazione del supporto multi-vendor. Il DGX elimina questi rischi.

Ott8 NVIDIA A100 80GB SXM4 GPU con 640GB di memoria GPU totale, sei NVSwitch con 12 NVLinks per GPU a 600 GB/s bidirezionale, 5 petaFLOPS di performance AI, doppie CPU AMD EPYC a 64 core (128 core), fino a 2TB di memoria di sistema, 30TB di storage interno NVMe Gen4, e dieci interfacce di rete Mellanox ConnectX-6 in una chassis rack da 6U.

Permette a qualsiasi GPU di scambiare dati con qualsiasi altra GPU a 600 GB/s senza coinvolgere la CPU o il bus PCIe, con una banda complessiva di 4,8 TB/s attraverso il nodo. L'addestramento distribuito sincronizza i gradienti tra tutte le GPU dopo ogni passo; su questa rete, quella sincronizzazione è abbastanza veloce da consentire a otto GPU di offrire quasi otto volte la capacità di throughput di una sola. I server GPU collegati tramite PCIe non possono replicare questo comportamento di scalabilità.

Stessa classe di complesso GPU: otto A100 80GB SXM4 GPU su una scheda madre NVSwitch. Il Supermicro è una piattaforma configurabile in cui si specificano CPU, memoria, storage e networking, tipicamente a un costo inferiore di piattaforma, e si possiede l'integrazione e il software stack. Il DGX è l'appliance sigillata NVIDIA con l'intero software stack e supporto mono-vendor inclusi. I team guidati dal budget optano per il Supermicro; quelli guidati dalla certezza scelgono il DGX. MillionMiner quotes entrambi.

DGX OS, una distribuzione basata su Ubuntu ottimizzata per l'hardware, è preinstallata. NVIDIA Base Command offre pianificazione dei lavori, orchestrazione e gestione delle flotte. Il catalogo NGC fornisce contenitori certificati e ottimizzati per le prestazioni per PyTorch, TensorFlow, RAPIDS, Triton e centinaia di altri framework, convalidati per l'hardware DGX. Il risultato pratico è che i workload di training vengono eseguiti entro poche ore dall'accensione.

Messa a punto completa di modelli nella classe da 30B a 70B parametri con parallelismo del modello attraverso il nodo, training di modelli più piccoli con batch molto grandi e servizio di inference di più modelli della classe da 70B contemporaneamente. Con MIG, il sistema si suddivide in fino a 56 istanze GPU isolate, ciascuna adatta per servire modelli nella classe da 7B a 13B, il che rende un DGX una piattaforma di inference multi-tenant completa.

Sì, e il sistema è progettato per questo. Otto adattatori HDR InfiniBand ConnectX-6 a singolo porta da 200Gb/s forniscono una porta fabric per GPU per GPUDirect RDMA, consentendo alle GPU in nodi diversi di scambiare dati direttamente attraverso la rete. L'architettura di riferimento DGX SuperPOD di NVIDIA documenta il percorso convalidato da un nodo a cluster di venti o più, Including topologia di rete, archiviazione e design di gestione.

Per una grande parte dei carichi di lavoro reali, sì. L'A100 è l'acceleratore AI più collaudato in produzione mai distribuito, con supporto maturo in tutte le attuali versioni di CUDA e in ogni principale framework. Le generazioni più recenti sono più veloci per GPU, ma il DGX A100 offre un vero training distribuito di classe NVSwitch a un costo della piattaforma ben inferiore agli appliance di generazione corrente, che è esattamente il compromesso che team di ottimizzazione, istituzioni di ricerca e operatori di inference cercano. La decisione di acquisto si basa sull'economia del carico di lavoro, non sulla corsa alla versione.

Questa è un'appliance per data center da 6U che pesa oltre cento chilogrammi e consuma diversi kilowatt a pieno carico di training, con raffreddamento ad alto volume da fronte a retro. Non è una macchina da ufficio. MillionMiner conferma i requisiti precisi di energia, raffreddamento e rack durante la configurazione, e offre hosting nei propri data center per team che preferiscono non provisioning facilities.

Invia i dettagli del tuo carico di lavoro e della distribuzione tramite il modulo di preventivo. un esperto di MillionMiner conferma le opzioni di configurazione, la memoria di sistema, lo storage, la copertura di supporto e il piano di distribuzione, quindi il sistema viene spedito in tutto il mondo DDP con dazi e dogane gestiti prima della consegna. Sono disponibili sia la guida all'integrazione rack sia la distribuzione ospitata presso le strutture di MillionMiner.