Nessun prodotto trovato per ''
NVIDIA
Modello: DGX A100
L'appliance AI original costruito da NVIDIA: otto GPU A100 80GB SXM4 su sei NVSwitches con 640GB di memoria GPU unificata, dual CPU AMD EPYC a 64 core, fino a 2TB di memoria di sistema e 30TB di storage NVMe Gen4, consegnato come un sistema integrato in fabbrica che esegue l'intera suite software DGX di NVIDIA. Infrastruttura di training turnkey con responsabilità di fornitore unico, fornita e spedita in tutto il mondo DDP da MillionMiner.
Richiedi il tuo preventivo per il server
Fateci sapere il vostro carico di lavoro e le vostre esigenze di implementazione. Il nostro specialista risponde entro 24 ore tramite email, WhatsApp o una telefonata.
Perché questo server è quotato su ordinazione
Questi server sono configurati e quotati su richiesta. La tua configurazione, archiviazione, rete, garanzia e integrazione nel rack determinano il prezzo finale, e la tua destinazione di consegna stabilisce le spese di spedizione e doganali. Compila il modulo sottostante e il nostro specialista risponderà entro 24 ore con un preventivo completo che include hardware, garanzia e consegna DDP in tutto il mondo.
Grazie! Il nostro specialista risponderà entro 24 ore con il tuo preventivo personalizzato.
Come funziona il tuo ordine del server
Invia modulo
Condividi dettagli sul carico di lavoro e sull'implementazione
Ottieni il tuo preventivo
Prezzi completi entro 24 ore
Recensione con uno specialista
Finalizza la configurazione e la consegna
Consegna
Spedito e pronto per l'implementazione
Autentico
Hardware testato
In tutto il mondo
Spedizione globale
Supporto
Esperti di Mining
Prezzi, tempi di consegna e opzioni di hosting. Consigli personalizzati dal nostro team di vendita.
Prezzi, tempi di consegna e opzioni di hosting. Consigli personalizzati dal nostro team di vendita.
Preventivo gratuito, risposta entro 24 ore. Nessuna chiamata di vendita.
4,7 / 5 su Trustpilot
Recensioni verificate dai clienti
Oltre 30.000 miner consegnati
Spedito in tutto il mondo dal 2020
1.200+ clienti in tutto il mondo
Affidabile in oltre 50 paesi
Il DGX A100 occupa un posto specifico nella storia dell'infrastruttura AI: è la macchina che ha definito l'aspetto di un nodo di formazione a 8-GPU. Ogni server HGX A100 sul mercato, comprese le piattaforme Supermicro presenti nel catalogo di MillionMiner, è costruito attorno alla scheda base GPU NVIDIA progettata per questo sistema. Acquistare il DGX significa acquistare l'originale, con tutto ciò che NVIDIA sovrappone sopra il silicio.
L'architettura di calcolo. Otto GPU NVIDIA A100 80GB SXM4 sono montate sulla scheda base HGX e interconnesse tramite sei NVSwitch in una topologia full-mesh. Ogni GPU dispone di 12 NVLinks di terza generazione, offrendo 600 GB/s di bandwidth bidirezionale GPU-GPU, con 4.8 TB/s di bandwidth di sezione trasversale aggregata attraverso il fabric. In termini pratici, la sincronizzazione dei gradienti tra tutte e otto le GPU si completa abbastanza rapidamente da permettere uno scaling del training distribuito vicino a lineare, che è l'intera ragione per cui esistono sistemi SXM più NVSwitch. Il nodo totalizza 640GB di memoria GPU pooled HBM2e e 5 petaFLOPS di performance AI, con una throughput di inferenza INT8 che raggiunge i 10 petaOPS. Le partizioni Multi-Instance GPU dividono ciascuna A100 in fino a sette istanze isolate, così un DGX può presentare fino a 56 GPU partizionate hardware per inferenza multi-tenant, configurazione che permette alla stessa macchina di allenarsi di notte e di servire decine di workload isolati di giorno.
La piattaforma host è dimensionata affinché le GPU non aspettino mai. Due processori AMD EPYC 7742 a 64-core forniscono 128 core e 256 thread per il caricamento dati, preprocessing e augmentation. La memoria di sistema raggiunge 2TB di DDR4. Lo storage si divide tra M.2 NVMe dedicati per il sistema operativo e 30TB di NVMe Gen4 interni per dataset, mantenendo gli I/O di training lontani dal percorso di boot. Dieci interfacce Mellanox ConnectX-6 includono otto adattatori HDR InfiniBand a singolo porta da 200Gb/s, disposti uno per GPU per GPUDirect RDMA, la topologia che permette a più nodi DGX di scambiare gradienti direttamente tra le memorie GPU attraverso la rete senza coinvolgere la CPU.
Lo stack software, che rappresenta la metà di ciò che i server white-box non includono. DGX OS, una distribuzione basata su Ubuntu ottimizzata per l’hardware, è installato di default. NVIDIA Base Command fornisce orchestrazione, scheduling e gestione della flotta. Il catalogo NGC fornisce container certificati per ogni grande framework di training e inferenza, validati in termini di prestazioni su questo sistema esatto, così il gap tra la ricezione e la prima sessione di training si misura in ore. Il supporto NVIDIA AI Enterprise copre l'intero stack sotto un unico contratto: quando un lavoro fallisce, non ci sono integratori che indicano NVIDIA e NVIDIA che indica a loro.
Il percorso di scaling è parte di ciò che si acquista. Il DGX A100 è il modulo di base dell'architettura di riferimento NVIDIA DGX SuperPOD, il blueprint pubblicato per scalare da un nodo a cluster di venti, cento o più, con topologia di rete, architettura di storage e strumenti di gestione validati. Le organizzazioni che iniziano con un DGX erediteranno un percorso documentato, dal tuning singolo nodo fino all'addestramento su scala cluster, piuttosto che doverlo progettare autonomamente.
La decisione di build-versus-buy, dichiarata onestamente. MillionMiner vende entrambe le opzioni. L’AS-4124GO-NART+ di Supermicro in questo catalogo offre lo stesso complesso GPU NVSwitch a otto A100 su un host configurabile a un costo inferiore, e per team con budget che preferiscono gestire personalmente integrazione e stack software, è la scelta razionale. Il DGX A100 è per l’acquirente opposto: aziende e istituti di ricerca dove l’approvvigionamento favorisce la responsabilità da parte di un singolo vendor, dove la conformità richiede una piattaforma di riferimento supportata, e dove il costo di ingegneri che debugano problemi di integrazione supera il sovrapprezzo dell’apparecchio. Primo run di training, un’unica corda da stringere e un percorso di scaling validato sono il prodotto.
Il DGX A100 resta l'appliance AI più ampiamente distribuita di sempre, con un ecosistema software che NVIDIA continua a mantenere attraverso le attuali release di CUDA. Come sistema rackmount 6U che consuma diversi kilowatt a pieno carico, appartiene all’ambiente dei data center; MillionMiner conferma i requisiti di energia e raffreddamento durante la configurazione, spedisce in tutto il mondo DDP con la dogana gestita, e offre hosting nelle proprie strutture per team che preferiscono non provisioningare infrastrutture in loco.
Ogni integratore competente può montare otto GPU A100 in un chassis. Quello che non può consegnare è il resto del DGX A100: il sistema che NVIDIA ha progettato intorno alla propria scheda madre HGX, validato come unitaria e supportato da un solo fornitore per tutto ciò che è all’interno del box.
L’hardware rappresenta il progetto di riferimento che ogni server con otto GPU A100 imita. Otto GPU A100 80GB SXM4 si interconnettono tramite sei NVSwitch, ogni GPU supporta 12 NVLinks per 600 GB/s di banda bidirezionale e 4,8 TB/s di throughput aggregato sulla rete, il doppio della generazione DGX precedente. Il nodo mette a disposizione 640GB di memoria GPU e garantisce 5 petaFLOPS di performance AI. Due processori AMD EPYC a 64-core, fino a 2TB di memoria di sistema DDR4, 30TB di NVMe Gen4 interna e dieci interfacce Mellanox ConnectX-6 (otto a 200Gb/s per la rete di calcolo, le altre per storage e gestione) completano un sistema di cui non manca nessun componente da specificare, acquistare o debugare.
Il software è ciò che le alternative white-box non possono eguagliare. DGX OS arriva già installato e ottimizzato. NVIDIA Base Command gestisce l’orchestrazione, la pianificazione dei job e la gestione del cluster. Il catalogo NGC fornisce container certificati e ottimizzati per le prestazioni di PyTorch, TensorFlow, RAPIDS, Triton e centinaia di altri framework, testati specificamente per l’hardware DGX. Quando qualcosa si comporta male in qualsiasi parte della pila — GPU, rete, driver o container — un unico contratto di supporto con un solo fornitore trova la soluzione.
Questa è la logica di acquisto. Il DGX A100 è pensato per team il cui costo di rischio di integrazione, tempo di debug e ritardo nelle sessioni di training supera il premio dell’apparecchio. MillionMiner fornisce il DGX A100 con consegna DDP in tutto il mondo e supporta la pianificazione del deployment, l’integrazione in rack e l’hosting.
I nostri specialisti in mining possono aiutarti a trovare il miner perfetto per la tua configurazione e il tuo budget.
Il DGX A100 è il sistema 8-GPU di NVIDIA, costruito, integrato e supportato end-to-end dall'azienda che produce le GPU. Ottava GPU A100 80GB SXM4 si collega tramite sei NVSwitch con 12 NVLinks per GPU a 600 GB/s, accorpando 640GB di memoria GPU dietro 5 petaFLOPS di prestazioni AI. Due CPU AMD EPYC da 64-core, fino a 2TB di memoria di sistema, 30TB di storage NVMe Gen4 e dieci interfacce Mellanox ConnectX-6 sono pre-integrate, con DGX OS e stack software certificato NVIDIA installati prima della spedizione. Accendilo, tira fuori un container da NGC e inizia l'addestramento lo stesso giorno.
Otto GPU A100 80GB, sei NVSwitches, 640GB di memoria aggregata, 5 petaFLOPS. Il sistema di riferimento rispetto al quale vengono misurati ogni server HGX A100.
DGX OS, Base Command e contenitori certificati NGC arrivano già installati. Un fornitore supporta l'intera stack dal silicon GPU al framework.
Otto porte fabric ConnectX-6 da 200Gb/s e l'architettura SuperPOD pubblicata da NVIDIA ti offrono un percorso convalidato da un sistema a un cluster di training.
NVIDIA
Contatto per prezzo
Supermicro
Contatto per prezzo
ASUS
Contatto per prezzo
Dell
Contatto per prezzo
Il complesso hardware GPU è simile nel design, poiché altri fornitori si basano sulla scheda madre HGX di NVIDIA. La differenza sta in tutto ciò che lo circonda: ingegneri NVIDIA, validazione e supporto del sistema completo come un unico prodotto, con DGX OS, orchestrazione Base Command e container certificati NGC preinstallati. I server white-box lasciano a te l'integrazione, l'ottimizzazione dell'OS e la coordinazione del supporto multi-vendor. Il DGX elimina questi rischi.
Ott8 NVIDIA A100 80GB SXM4 GPU con 640GB di memoria GPU totale, sei NVSwitch con 12 NVLinks per GPU a 600 GB/s bidirezionale, 5 petaFLOPS di performance AI, doppie CPU AMD EPYC a 64 core (128 core), fino a 2TB di memoria di sistema, 30TB di storage interno NVMe Gen4, e dieci interfacce di rete Mellanox ConnectX-6 in una chassis rack da 6U.
Permette a qualsiasi GPU di scambiare dati con qualsiasi altra GPU a 600 GB/s senza coinvolgere la CPU o il bus PCIe, con una banda complessiva di 4,8 TB/s attraverso il nodo. L'addestramento distribuito sincronizza i gradienti tra tutte le GPU dopo ogni passo; su questa rete, quella sincronizzazione è abbastanza veloce da consentire a otto GPU di offrire quasi otto volte la capacità di throughput di una sola. I server GPU collegati tramite PCIe non possono replicare questo comportamento di scalabilità.
Stessa classe di complesso GPU: otto A100 80GB SXM4 GPU su una scheda madre NVSwitch. Il Supermicro è una piattaforma configurabile in cui si specificano CPU, memoria, storage e networking, tipicamente a un costo inferiore di piattaforma, e si possiede l'integrazione e il software stack. Il DGX è l'appliance sigillata NVIDIA con l'intero software stack e supporto mono-vendor inclusi. I team guidati dal budget optano per il Supermicro; quelli guidati dalla certezza scelgono il DGX. MillionMiner quotes entrambi.
DGX OS, una distribuzione basata su Ubuntu ottimizzata per l'hardware, è preinstallata. NVIDIA Base Command offre pianificazione dei lavori, orchestrazione e gestione delle flotte. Il catalogo NGC fornisce contenitori certificati e ottimizzati per le prestazioni per PyTorch, TensorFlow, RAPIDS, Triton e centinaia di altri framework, convalidati per l'hardware DGX. Il risultato pratico è che i workload di training vengono eseguiti entro poche ore dall'accensione.
Messa a punto completa di modelli nella classe da 30B a 70B parametri con parallelismo del modello attraverso il nodo, training di modelli più piccoli con batch molto grandi e servizio di inference di più modelli della classe da 70B contemporaneamente. Con MIG, il sistema si suddivide in fino a 56 istanze GPU isolate, ciascuna adatta per servire modelli nella classe da 7B a 13B, il che rende un DGX una piattaforma di inference multi-tenant completa.
Sì, e il sistema è progettato per questo. Otto adattatori HDR InfiniBand ConnectX-6 a singolo porta da 200Gb/s forniscono una porta fabric per GPU per GPUDirect RDMA, consentendo alle GPU in nodi diversi di scambiare dati direttamente attraverso la rete. L'architettura di riferimento DGX SuperPOD di NVIDIA documenta il percorso convalidato da un nodo a cluster di venti o più, Including topologia di rete, archiviazione e design di gestione.
Per una grande parte dei carichi di lavoro reali, sì. L'A100 è l'acceleratore AI più collaudato in produzione mai distribuito, con supporto maturo in tutte le attuali versioni di CUDA e in ogni principale framework. Le generazioni più recenti sono più veloci per GPU, ma il DGX A100 offre un vero training distribuito di classe NVSwitch a un costo della piattaforma ben inferiore agli appliance di generazione corrente, che è esattamente il compromesso che team di ottimizzazione, istituzioni di ricerca e operatori di inference cercano. La decisione di acquisto si basa sull'economia del carico di lavoro, non sulla corsa alla versione.
Questa è un'appliance per data center da 6U che pesa oltre cento chilogrammi e consuma diversi kilowatt a pieno carico di training, con raffreddamento ad alto volume da fronte a retro. Non è una macchina da ufficio. MillionMiner conferma i requisiti precisi di energia, raffreddamento e rack durante la configurazione, e offre hosting nei propri data center per team che preferiscono non provisioning facilities.
Invia i dettagli del tuo carico di lavoro e della distribuzione tramite il modulo di preventivo. un esperto di MillionMiner conferma le opzioni di configurazione, la memoria di sistema, lo storage, la copertura di supporto e il piano di distribuzione, quindi il sistema viene spedito in tutto il mondo DDP con dazi e dogane gestiti prima della consegna. Sono disponibili sia la guida all'integrazione rack sia la distribuzione ospitata presso le strutture di MillionMiner.