NVIDIA

Nvidia H100 NVL (94GB) AI and HPC GPU

Modèle: H100 NVL

Deux cartes NVIDIA H100 PCIe connectées par 3 ponts NVLink forment un pool mémoire HBM3 unifié de 94 Go à une bande passante combinée de 3 938 Go/s. Architecture Hopper avec des Tensor Cores de quatrième génération et FP8 Transformer Engine. 14 592 cœurs CUDA par carte, TDP de 400 W par carte. PCIe Gen 5 x16. MIG pour jusqu'à 7 instances par carte. Conçu pour l'inférence LLM lorsque les modèles dépassent la capacité d'un seul GPU de 80 Go. Compatible avec les plates-formes serveur PCIe standard sans HGX baseboard. Refroidissement passif pour le châssis du serveur. Contactez MillionMiner pour les tarifs.

Demandez votre devis pour un cluster GPU

Indiquez-nous vos besoins en matière de déploiement. Notre spécialiste du matériel AI répondra dans les 24 heures par e-mail, WhatsApp ou appel.

Pourquoi les GPUs sont vendus par consultation

Les clusters GPU pour les charges de travail AI et HPC sont configurés selon vos exigences exactes — quantité, topologie d'interconnexion, consommation électrique et refroidissement influencent tous le prix final. Soumettez le formulaire ci-dessous et notre spécialiste vous répondra dans les 24 heures avec un devis complet adapté à votre déploiement.

Comment fonctionne votre commande GPU

1

Soumettre le formulaire

Dites-nous votre cas d'utilisation et la quantité

2

Obtenez votre devis

Tarification complète dans les 24 heures

3

Avis avec un spécialiste

Discuter de la configuration, de l'interconnexion et du refroidissement.

4

Déployer

Matériel expédié et prêt à fonctionner.

Authentique

Matériel testé

Dans le monde entier

Expédition mondiale

Assistance

Experts en Mining

Caractéristiques complètes

Modèle H100 NVL

Demandez un devis d'hébergement pour un Bitcoin Miner

Devis gratuit, réponse en 24h. Pas d'appel commercial.

4.4
étoile étoile étoile étoile étoile

4,7 / 5 sur Trustpilot

Avis clients vérifiés

Plus de 30 000 mineurs livrés

Expédié dans le monde entier depuis 2020

Plus de 1 200 clients dans le monde

Fiable dans plus de 50 pays

ISO Fabriqué en Allemagne trustpilot
avis-google

Obtenez un devis pour le Nvidia H100 NVL (94GB) AI and HPC GPU

Tarification, délai de livraison et options d'hébergement. Conseils personnalisés de notre équipe commerciale.

Répondez dans les 24h via courriel, WhatsApp ou appel.

Détails du produit

NVIDIA H100 NVL 94GB PCIe Tensor Core GPU : Architecture en paire NVLink, inférence LLM et guide de déploiement

Le H100 NVL est la réponse de NVIDIA au plafond de 80 Go dans sa propre gamme H100. Le H100 SXM offre 80 Go par carte sur une HGX baseboard, ce qui est leader de l'industrie pour l'entraînement. Mais pour l'inférence sur des modèles de 70B paramètres et plus à FP16 (empreinte mémoire de 140 Go et plus), une seule carte de 80 Go n'est pas suffisante. Le NVL résout cela en associant deux cartes PCIe H100 via trois ponts NVLink pour former un pool unifié de 94 Go HBM3 que la pile logicielle perçoit comme un espace mémoire unique. Architecture par carte : GH100 GPU sur TSMC 4 nm avec 14 592 cœurs CUDA (132 SM sur les 144 activés), 456 Tensor Cores de quatrième génération prenant en charge FP64, TF32, FP16, BF16, FP8 et INT8 de précision avec le Transformer Engine qui sélectionne dynamiquement la précision optimale par couche lors de l'inférence. 47 Go HBM3 par carte à environ 1 979 Go/s de bande passante. Par paire NVLink : 94 Go unifiés à 3 938 Go/s combinés, connectés par une bande passante NVLink bidirectionnelle de 600 Go/s entre les deux cartes. Le Transformer Engine est la caractéristique déterminante du H100 par rapport à l'A100. Il gère automatiquement le calcul à précision mixte sur FP8 et FP16 par couche du réseau de neurones, offrant jusqu'à 4x de débit d'entraînement et 30x de débit d'inférence sur des modèles basés sur des transformers par rapport à l'A100. Le service LLM en production sur des paires H100 NVL génère 2x à 3x plus de jetons par seconde et par dollar que les déploiements A100 80 Go pour des modèles comptant entre 30B et 70B paramètres. La TDP est de 400 W par carte en mode énergie par défaut, avec le câble PCIe 16 broches supportant une configuration entre 200 W et 600 W par carte. À 400 W par paire par défaut (800 W au total), la paire NVL consomme à peu près la même puissance qu'un H100 SXM à 700 W mais offre 94 Go contre 80 Go grâce à la simplicité d'infrastructure PCIe-slot. La capacité MIG permet de créer jusqu'à 7 instances entièrement isolées par carte (14 au total sur la paire) avec mémoire, cache et calcul dédiés. Pour l'inférence multi-locataires, cette granularité est précieuse : servir différents clients ou modèles sur des tranches GPU isolées avec une QoS garantie. Le NVL s'adapte aux plates-formes serveur PCIe standards. Tout serveur disposant de deux emplacements PCIe Gen 5 x16 adjacents, d'un dégagement physique pour l'assemblage du NVLink bridge (trois ponts couvrant les deux cartes), et d'un flux d'air adéquat pour un refroidissement passif combiné de 800 W. Les plates-formes Supermicro, Dell PowerEdge, HPE ProLiant et Lenovo ThinkSystem documentent toutes la compatibilité du H100 NVL. Aucun HGX baseboard requis. Par rapport aux autres offres de MillionMiner. Par rapport au H100 SXM 80Go (liste séparée) : le SXM offre une bande passante par GPU plus élevée (3 350 Go/s) et une connectivité NVSwitch pour l'entraînement multi-GPU, mais nécessite une infrastructure HGX baseboard. Contre le H200 NVL 141Go : le H200 double la capacité mémoire avec le plus récent HBM3e pour les opérateurs qui ont besoin d'encore plus de marge VRAM. Contre le RTX PRO 6000 96Go (10 000 à 13 000 dollars) : le RTX PRO 6000 offre une architecture Blackwell plus récente avec des FP32 TFLOPS plus élevés mais manque de bande passante HBM, du Transformer Engine et de l'écosystème Hopper pour les centres de données éprouvé.

NVIDIA H100 NVL 94GB: Le chemin PCIe vers la mémoire unifiée pour l'inférence de grands modèles

Le H100 NVL existe pour résoudre un problème spécifique : le H100 SXM standard dispose de 80 Go par carte, ce qui n’est pas suffisant pour accueillir des modèles à 70 milliards de paramètres en FP16 (environ 140 Go) sur un seul GPU. L’NVL associe deux cartes H100 PCIe via trois ponts NVLink en une piscine de mémoire unifiée de 94 Go à une bande passante combinée de 3 938 Go/s, permettant de faire fonctionner des modèles dépassant 80 Go sans nécessiter l’infrastructure de la carte mère HGX que demandent les cartes SXM. Il s’agit d’un produit PCIe. Il s’adapte aux cartes mères serveurs standard avec deux emplacements PCIe Gen 5 x16 adjacents et un espace suffisant pour les ponts NVLink. Pas de carte mère HGX, pas de tissu NVSwitch, pas de châssis serveur personnalisé requis. La paire NVL s’intègre dans une infrastructure serveur existante conçue à l’origine pour des cartes A100 PCIe ou similaires, offrant une voie de mise à niveau sans remplacement du serveur.

Par carte : 14 592 cœurs CUDA, 456 Tensor Cores quatrième génération avec précision FP8 et Transformer Engine, 47 Go HBM3. Par paire : 29 184 cœurs CUDA combinés, 94 Go HBM3 unifiés, 3 938 Go/s de bande passante mémoire combinée. TDP 400W par carte (800W par paire, réglable de 200W à 600W par carte). Refroidissement passif nécessitant un flux d’air dans le châssis serveur. MIG divise chaque carte en jusqu’à 7 instances isolées.

La décision entre NVL et SXM dépend de l’infrastructure. SXM offre une bande passante par GPU plus élevée (3 350 GB/s contre environ 1 979 GB/s par carte pour NVL) et connecte jusqu’à 8 GPU via NVSwitch à 900 GB/s pour les charges d’entraînement. NVL s’adapte aux plateformes serveur PCIe existantes pour les charges d’inférence où la piscine unifiée de 94 Go est plus importante que la vitesse d’interconnexion multi-GPU pour l’entraînement.

Besoin d'aide pour choisir ?

Nos spécialistes en minage peuvent vous aider à trouver le mineur parfait pour votre configuration et votre budget.

NVIDIA H100 NVL 94 Go PCIe Tensor Core Paire de GPU

Deux cartes H100 PCIe reliées via 3× NVLink en une mémoire pool unifiée de 94 Go HBM3 à bande passante combinée de 3 938 Go/s. 14 592 cœurs CUDA par carte, unités Tensor de quatrième génération avec le FP8 Transformer Engine. TDP de 400 W par carte. PCIe Gen 5 x16. MIG pour 7 instances par carte. Conçu pour l'inférence LLM lorsque les modèles dépassent les 80 Go de VRAM sur une seule GPU. Compatible avec les plateformes serveur PCIe standard sans HGX baseboard. Refroidissement passif. Contactez MillionMiner pour les tarifs et la disponibilité.

Mémoire unifiée de 94 Go via 3x ponts NVLink

Deux cartes H100 PCIe couplées en une seule mémoire pool HBM3 de 94Go à 3 938 GB/s. Convient aux modèles qui dépassent la capacité de 80Go d'un seul GPU.

FP8 Transformer Engine pour l'inférence des LLM

Cœurs Tensor de quatrième génération s’auto-sélectionnent FP8/FP16 par couche. Jusqu’à 30x le débit d’inférence par rapport à l’A100 sur les modèles Transformer.

Format PCIe, pas de HGX requis

Compatible avec les cartes mères serveur standard dotées de deux emplacements PCIe Gen 5 x16. Pas de baseboard HGX. Chemin de mise à niveau à partir de l'infrastructure PCIe A100 existante.

Foire aux questions

Questions fréquemment posées

Deux cartes PCIe H100 connectées via trois ponts NVLink créant un pool mémoire HBM3 unifié de 94GB. La paire apparaît comme un espace mémoire accessible unique pour la pile logicielle. 47GB par carte, 94GB au total. Confirmez avec MillionMiner si le prix indiqué couvre la paire ou une seule carte.

NVL : facteur de forme PCIe, 94Go unifiés par paire, s'adapte aux cartes mères serveur standard, optimisé pour l'inférence LLM. SXM : facteur de forme mezzanine, 80Go par carte, nécessite une carte mère HGX, NVSwitch connecte jusqu'à 8 GPU à 900 GB/s, optimisé pour la formation multi-GPU. NVL est la voie d'infrastructure plus simple. SXM est la voie de formation à haute performance.

Modèles à 70B paramètres en FP16 (environ 140 GO avec une marge de cache KV sur la paire). Modèles à 30B à 40B en FP16 avec de grandes tailles de lot. Llama 3 70B, DeepSeek 67B, et des modèles à poids ouverts similaires de la frontière fonctionnent sur la paire NVL sans quantification.

Gestion automatique en précision mixte au niveau matériel, unique à Hopper et aux architectures NVIDIA plus récentes. Sélectionne dynamiquement la précision FP8 ou FP16 pour chaque couche du réseau neuronal lors de l'inférence et de l'entraînement, maximisant le débit sans réglage manuel de la précision. Fournit jusqu'à 4x d'accélération de l'entraînement et 30x de débit d'inférence par rapport à A100 sur les modèles Transformer.

Tout serveur disposant de deux slots PCIe Gen 5 x16 adjacents et d'un dégagement physique pour trois ponts NVLink couvrant les deux cartes. Supermicro, Dell PowerEdge, HPE ProLiant, Lenovo ThinkSystem documentent tous la compatibilité. Les plateformes CPU AMD EPYC et Intel Xeon Scalable sont prises en charge.

Oui. Jusqu’à 7 instances entièrement isolées par carte (14 au total pour la paire) avec mémoire, cache et calcul dédiés. Chaque instance fonctionne indépendamment avec une QoS garantie.

H100 NVL pair : architecture Hopper, mémoire unifiée de 94 Go HBM3, 3 938 Go/s de bande passante combinée, FP8 Transformer Engine, 800 W par paire. A100 80 Go : Ampere, 80 Go HBM2e, 1 935 Go/s, pas de FP8, 300 W. Le H100 NVL offre environ 2x à 3x plus de jetons d'inférence par seconde pour les modèles Transformer. Le A100 coûte beaucoup moins par carte.

Même architecture de base Hopper. Le H200 NVL passe à 141GB HBM3e (contre 94GB HBM3) avec une bande passante plus élevée. Pour les modèles dépassant 94GB, le H200 NVL est la meilleure option. Pour les modèles pouvant tenir dans 94GB, le H100 NVL offre un excellent rapport qualité/prix.

Paire H100 NVL : 94GB HBM3, bande passante de 3 938 GB/s, Transformer Engine FP8, MIG 7 instances par carte, écosystème de centre de données éprouvé. RTX PRO 6000 : 96GB GDDR7, 1 792 GB/s, sans Transformer Engine, architecture Blackwell plus récente, 125 TFLOPS FP32. La H100 NVL l'emporte sur la bande passante HBM (2,2x) et le débit d'inférence Transformer Engine. La RTX PRO 6000 l'emporte sur le calcul FP32 et le coût par carte.