Nessun prodotto trovato per ''
NVIDIA
Modello: H100 NVL
Richiedi il tuo preventivo per il cluster GPU
Indica i tuoi requisiti di distribuzione. Il nostro specialista hardware AI risponde entro 24 ore via email, WhatsApp o telefono.
Perché le GPU vengono vendute tramite consulenza.
I cluster GPU per workload AI e HPC sono configurati secondo le tue esigenze precise — quantità, topologia di interconnessione, consumo energetico e raffreddamento influenzano tutti il prezzo finale. Compila il modulo qui sotto e il nostro esperto risponderà entro 24 ore con un preventivo completo su misura per il tuo deployment.
Grazie! Il nostro specialista risponderà entro 24 ore con il tuo preventivo personalizzato.
Come funziona il tuo ordine GPU
Invia modulo
Indica il tuo caso d'uso e la quantità
Ottieni il tuo preventivo
Prezzi completi entro 24 ore
Recensione con uno specialista
Discutere la configurazione, l'interconnessione e il raffreddamento.
Distribuisci
Hardware spedito e pronto all'uso
Autentico
Hardware testato
In tutto il mondo
Spedizione globale
Supporto
Esperti di Mining
Due NVIDIA H100 PCIe schede collegate tramite 3x ponti NVLink in un pool di memoria unificato da 94GB HBM3, con banda passante combinata di 3,938 GB/s. Architettura Hopper con Tensor Cores di quarta generazione e FP8 Transformer Engine. 14,592 CUDA cores per scheda, 400W TDP per scheda. PCIe Gen 5 x16. MIG fino a 7 istanze per scheda. Progettato specificamente per l'inferenza LLM in cui i modelli superano la capacità di 80GB per singola GPU. Si adatta alle piattaforme server PCIe standard senza HGX baseboard. Raffreddamento passivo per chassis del server. Contatta MillionMiner per i prezzi.
Prezzi, tempi di consegna e opzioni di hosting. Consigli personalizzati dal nostro team di vendita.
Prezzi, tempi di consegna e opzioni di hosting. Consigli personalizzati dal nostro team di vendita.
Preventivo gratuito, risposta entro 24 ore. Nessuna chiamata di vendita.
4,7 / 5 su Trustpilot
Recensioni verificate dai clienti
Oltre 30.000 miner consegnati
Spedito in tutto il mondo dal 2020
1.200+ clienti in tutto il mondo
Affidabile in oltre 50 paesi
L'H100 NVL è la risposta di NVIDIA al problema del limite di 80GB nella propria linea H100.
L'H100 SXM fornisce 80GB per scheda su una scheda-base HGX, che è all'avanguardia nel settore per l'addestramento. Ma per l'inferenza su modelli da 70 miliardi di parametri o più a FP16 (impronta di memoria superiore a 140GB), una singola scheda da 80GB non basta.
L'NVL risolve questo accoppiando due schede H100 PCIe tramite tre ponti NVLink in un pool unificato di 94GB HBM3 che lo stack software vede come un unico spazio di memoria.
Architettura per scheda: GH100 GPU presso TSMC a 4 nm con 14.592 core CUDA (132 SM sui 144 abilitati), 456 Tensor Core di quarta generazione che supportano FP64, TF32, FP16, BF16, FP8 e INT8 con il Transformer Engine che seleziona dinamicamente la precisione ottimale per ogni strato durante l'inferenza.
47GB HBM3 per scheda a una bandwidth di circa 1,979 GB/s.
Per coppia NVLink: 94GB unificati a 3.938 GB/s combinati, collegati a una banda bidirezionale NVLink di 600 GB/s tra le due schede.
Il Transformer Engine è la caratteristica distintiva dell'H100 rispetto all'A100. Gestisce automaticamente il calcolo a precisione mista tra FP8 e FP16 per ogni strato di rete neurale, offrendo fino a 4x la velocità di addestramento e 30x la velocità di inferenza sui modelli basati su transformer rispetto all'A100. Il serving di LLM in produzione su coppie H100 NVL genera da 2x a 3x più token al secondo per dollaro rispetto alle implementazioni A100 da 80GB per modelli nel range da 30 miliardi a 70 miliardi di parametri.
Il TDP è di 400W per scheda come modalità di alimentazione predefinita, con il cavo PCIe a 16 pin che supporta una configurazione tra 200W e 600W per scheda. Con 400W di default per coppia (800W totali), la coppia NVL consuma approssimativamente la stessa potenza di un H100 SXM a 700W ma eroga 94GB contro 80GB con la semplicità dell'infrastruttura PCIe-slot.
La capacità MIG crea fino a 7 istanze completamente isolate per scheda (14 in totale sulla coppia) con memoria dedicata, cache e calcolo. Per l'inferenza multi-tenant, questa granularità è preziosa: servire clienti o modelli differenti su slice di GPU isolate con QoS garantita.
L'NVL è compatibile con piattaforme server PCIe standard. Qualsiasi server con due slot PCIe Gen 5 x16 adiacenti, spazio fisico sufficiente per l'assemblaggio del bridge NVLink (tre bridge che attraversano entrambe le schede) e un flusso d'aria adeguato per il raffreddamento passivo combinato di 800W.
Le piattaforme Supermicro, Dell PowerEdge, HPE ProLiant e Lenovo ThinkSystem documentano tutte la compatibilità con H100 NVL. Non è richiesta una scheda-base HGX.
Rispetto alle altre offerte di MillionMiner.
Contro l'H100 SXM 80GB (elenco separato): l'SXM offre una maggiore banda per GPU (3.350 GB/s) e connettività NVSwitch per l'addestramento multi-GPU, ma richiede l'infrastruttura HGX baseboard.
Contro l'H200 NVL 141GB: l'H200 raddoppia la capacità di memoria con la più recente HBM3e per operatori che hanno bisogno di ancora più margine VRAM.
Contro il RTX PRO 6000 96GB (da 10.000 a 13.000 USD): il RTX PRO 6000 offre l'architettura Blackwell più recente con FP32 TFLOPS superiore ma manca della banda HBM, del Transformer Engine e dell'ecosistema Hopper per data center comprovato.
L'H100 NVL esiste per risolvere un problema specifico: l'H100 SXM standard ha 80GB per scheda, che non sono sufficienti per adattare modelli da 70B parametri in FP16 (circa 140GB) su un singolo GPU. L'NVL combina due schede H100 PCIe tramite tre ponti NVLink in un pool di memoria unificato da 94GB con una banda passante combinata di 3.938 GB/s, permettendo di gestire modelli che superano gli 80GB senza richiedere l'infrastruttura HGX su scheda base che le schede SXM richiedono. Questo è un prodotto PCIe. Si adatta alle schede madri standard dei server con due slot PCIe Gen 5 x16 adiacenti e spazio sufficiente per i ponti NVLink. Nessuna scheda base HGX, nessuna rete NVSwitch, nessun chassis server personalizzato richiesto. La coppia NVL si collega all'infrastruttura server esistente, originariamente progettata per schede A100 PCIe o simili, offrendo un percorso di aggiornamento senza sostituire il server. Per scheda: 14.592 CUDA cores, 456 Tensor Cores di quarta generazione con precisione FP8 e Transformer Engine, 47GB HBM3. Per coppia: 29.184 CUDA cores combinati, 94GB HBM3 unificati, 3.938 GB/s di banda memoria combinata. TDP 400W per scheda (800W per coppia, configurabile da 200W a 600W per scheda). Raffreddamento passivo che richiede il flusso d'aria del chassis server. MIG divide ogni scheda in fino a 7 istanze isolate.
La decisione tra NVL e SXM dipende dall'infrastruttura. SXM offre una banda passante per GPU superiore (3.350 GB/s contro circa 1.979 GB/s per scheda di NVL) e collega fino a 8 GPU tramite NVSwitch a 900 GB/s per carichi di lavoro di training. NVL si adatta alle piattaforme server PCIe esistenti per carichi di lavoro di inferenza, dove il pool unificato da 94GB è più importante della velocità di interconnessione tra più GPU per il training.
I nostri specialisti in mining possono aiutarti a trovare il miner perfetto per la tua configurazione e il tuo budget.
Due schede H100 PCIe collegate tramite 3x NVLink in un pool di memoria HBM3 da 94 GB unificato, con banda complessiva di 3,938 GB/s. 14,592 CUDA cores per scheda, Tensor Cores di quarta generazione con FP8 Transformer Engine. 400W TDP per scheda. PCIe Gen 5 x16. MIG per 7 istanze per scheda. Progettato per l'inferenza LLM dove i modelli superano l'80 GB di VRAM su singola GPU. Si adatta alle piattaforme server PCIe standard senza HGX baseboard. Raffreddamento passivo. Contatta MillionMiner per prezzi e disponibilità.
Due schede H100 PCIe collegate in un unico pool di memoria HBM3 da 94GB a 3.938 GB/s. Si adatta a modelli che Superano la capacità di 80GB di una singola GPU.
I Tensor Cores di quarta generazione auto-selezionano FP8/FP16 per strato. Fino a 30x di throughput di inferenza rispetto all'A100 sui modelli Transformer.
Compatibile con schede madri per server standard con due slot PCIe Gen 5 x16. Nessuna HGX baseboard. Percorso di aggiornamento dall'infrastruttura A100 PCIe esistente.
Due schede PCIe H100 collegate tramite tre NVLink bridges creano un pool di memoria unificato di 94GB HBM3. La coppia appare come uno spazio di memoria indirizzabile unico per lo stack software. 47GB per scheda, 94GB complessivi. Confermare con MillionMiner se il prezzo di listino copre la coppia o una singola scheda.
NVL: form factor PCIe, 94GB unificati per coppia, si adatta alle schede madri standard dei server, ottimizzato per LLM inference. SXM: form factor mezzanine, 80GB per scheda, richiede scheda base HGX, NVSwitch collega fino a 8 GPU a 900 GB/s, ottimizzato per training multi-GPU. NVL è il percorso infrastrutturale più semplice. SXM è il percorso di training ad alte prestazioni.
Modelli a 70B parametri a FP16 (circa 140GB con spazio per la KV cache sul pair). Modelli da 30B a 40B a FP16 con grandi batch size. Llama 3 70B, DeepSeek 67B e modelli open-weight frontier simili vengono eseguiti sul pair NVL senza quantizzazione.
Gestione automatica della precisione mista a livello hardware, unica per Hopper e per le architetture NVIDIA più recenti. Seleziona dinamicamente la precisione FP8 o FP16 per ogni strato della rete neurale durante l'inferenza e l'addestramento, massimizzando il throughput senza regolazione manuale della precisione. Fornisce fino a 4x di velocità di addestramento e 30x di throughput di inferenza rispetto ad A100 sui modelli Transformer.
Qualsiasi server con due slot PCIe Gen 5 x16 adiacenti e spazio fisico sufficiente per tre ponti NVLink che si estendono su entrambe le schede. Supermicro, Dell PowerEdge, HPE ProLiant, Lenovo ThinkSystem documentano la compatibilità. Piattaforme CPU AMD EPYC e Intel Xeon Scalable supportate.
Sì. Fino a 7 istanze completamente isolate per scheda (14 in totale nel paio) con memoria dedicata, cache e capacità di calcolo. Ogni istanza funziona in modo indipendente con QoS garantita.
Coppia H100 NVL: architettura Hopper, 94GB HBM3 unificata, 3,938 GB/s di banda combinata, FP8 Transformer Engine, 800W per coppia. A100 80GB: Ampere, 80GB HBM2e, 1,935 GB/s, nessun FP8, 300W. L'H100 NVL fornisce circa 2x–3x token di inferenza al secondo per modelli transformer. L'A100 costa significativamente meno per scheda.
Stessa architettura base Hopper. L'upgrade dell'H200 NVL passa a 141GB HBM3e (rispetto a 94GB HBM3) con banda passante più elevata. Per i modelli che sforano i 94GB, l'H200 NVL rappresenta il salto avanti. Per i modelli che rientrano nei 94GB, l'H100 NVL offre un ottimo rapporto qualità/prezzo.
Coppia H100 NVL: 94GB HBM3, larghezza di banda di 3.938 GB/s, Transformer Engine FP8, MIG 7 istanze per scheda, ecosistema data center comprovato. RTX PRO 6000: 96GB GDDR7, 1.792 GB/s, senza Transformer Engine, architettura Blackwell più recente, 125 TFLOPS FP32. L'H100 NVL vince sulla larghezza di banda HBM (2.2x) e throughput di inferenza Transformer Engine. L'RTX PRO 6000 vince sulla capacità di calcolo FP32 e sul costo per scheda.