Gigabyte
Modèle: G893-ZD1-AAX5
Plateforme 8U de Gigabyte pour la carte mère NVIDIA HGX B200 : huit GPUs Blackwell B200 SXM avec 180 Go de HBM3e chacun, 1,4 To et 64 To/s de mémoire par nœud, reliés par NVLink de cinquième génération à 1,8 To/s par GPU via NVSwitch. Deux processeurs AMD EPYC 9005 ou 9004, vingt-quatre modules DDR5, huit baies NVMe Gen5, et douze alimentations Titanium de 3000W en configuration redondante 6+6 l’alimentent, en refroidissement par air. La frontière Blackwell actuelle du AI en single-node, cotée et expédiée dans le monde entier en DDP par MillionMiner.
Demandez votre devis pour le serveur
Dites-nous votre charge de travail et vos besoins de déploiement. Notre spécialiste vous répondra dans les 24 heures par e-mail, WhatsApp ou par appel.
Pourquoi ce serveur est-il indiqué en commande ?
Ces serveurs sont configurés et proposés sur devis à la commande. Votre configuration, stockage, réseau, garantie et intégration en rack déterminent le prix final, et votre destination de livraison fixe les frais d'expédition et de douane. Soumettez le formulaire ci-dessous et notre spécialiste répondra dans les 24 heures avec un devis complet incluant le matériel, la garantie et la livraison DDP dans le monde entier.
Merci ! Notre spécialiste vous répondra dans les 24 heures avec votre devis personnalisé.
Comment fonctionne votre commande de serveur
Soumettre le formulaire
Partagez la charge de travail et les détails du déploiement.
Obtenez votre devis
Tarification complète dans les 24 heures
Avis avec un spécialiste
Finaliser la configuration et la livraison
Livraison
Expédié et prêt pour le déploiement
Authentique
Matériel testé
Dans le monde entier
Expédition mondiale
Assistance
Experts en Mining
Tarification, délai de livraison et options d'hébergement. Conseils personnalisés de notre équipe commerciale.
Tarification, délai de livraison et options d'hébergement. Conseils personnalisés de notre équipe commerciale.
Chaque génération de GPU est vendue comme une révolution. La manière précise d’évaluer Blackwell consiste à différencier les changements physiques des multiplicateurs marketing, et ce serveur récompense cet exercice, car les changements physiques sont substantiels.
Le GPU lui-même. Chaque NVIDIA B200 est un package dual-die : deux dies, chacun à la limite de fabrication du réticule, reliés par une interface die-to-die de 10 TB/s et présentant au logiciel comme un seul GPU avec 208 milliards de transistors. Chacun contient 180GB de HBM3e à environ 8 TB/s de bande passante, contre 141GB à 4,8 TB/s sur le H200. La deuxième génération du Transformer Engine étend l’échelle de précision jusqu’à FP4 avec une micro-mise à l’échelle tensorielle, un matériel qui suit la quantification à une granularité fine pour que l’inférence en quatre bits conserve une précision que la quantification naïve antérieure perdait. La NVLink de cinquième génération double le tissu à 1,8 TB/s par GPU.
Les mathématiques du nœud. Huit GPUs B200 SXM sur la carte de base HGX regroupent 1 440GB de HBM3e, 64 TB/s de bande passante mémoire agrégée, et 144 petaFLOPS de calcul FP4, avec NVSwitch connectant chaque GPU à tous les autres à pleine vitesse NVLink, soit 14,4 TB/s de tissu agrégé. En termes de charge de travail : des modèles de quelques centaines de milliards de paramètres s’affinent en pleine précision dans un seul nœud, des modèles de type trillion de paramètres servent en temps réel sur un seul nœud en FP4, l’inférence longue portée avec une marge de cache KV que même un nœud Hopper ne peut égaler, et les architectures Mixture-of-Experts acheminent entre experts sur un tissu deux fois plus rapide que la génération H200. Les comparaisons publiées par NVIDIA, jusqu’à 15x pour l’inférence en temps réel de trillion de paramètres et environ 3x pour l’entraînement par rapport à la génération H100, sont des chiffres fournisseur, mais les delta matériels qui les sous-tendent ne le sont pas.
La plateforme Gigabyte. L’hôte est doté de deux AMD EPYC 9005 ou 9004, atteignant 192 cœurs par socket sur la gamme 9005, ce qui est important pour la tokenisation, l’augmentation, et le chargement de données qui alimentent huit GPU de cette classe. Vingt-quatre modules DDR5 occupent une seule par canal sur douze canaux par processeur, la configuration qui maintient la bande passante mémoire complète plutôt que de la troquer contre une capacité accrue. Le stockage comporte huit baies NVMe Gen5 à chaud pour données locales. La configuration PCIe est conçue pour le clustering : huit emplacements à un seul slot, chacun pour un adaptateur 400 Gb/s par GPU, la topologie un-à-un souhaitée par GPUDirect RDMA, sur NVIDIA Quantum-2 InfiniBand ou Spectrum-X Ethernet, avec quatre emplacements supplémentaires à double slot pour le stockage et la gestion du réseau. L’alimentation comprend douze blocs de 3000W 80 PLUS Titanium en configuration redondante 6+6, et le design thermique maintient tout le complexe GPU refroidi à l’air, ce qui permet un déploiement en centres de données classiques plutôt que dans la minorité adaptées au liquide.
La décision contre les systèmes H200 dans ce catalogue. Les plateformes HGX H200 de Lenovo et ASUS offrent 1,1TB par nœud sur un fabric de 900 GB/s, et pour les équipes affinant des modèles de classe 70B ou opérant dans cette enveloppe mémoire, elles restent l’achat rationnel. Le nœud B200 justifie son supplément de prix dans trois situations : les flottes d’inférence servant des modèles à l’échelle de la frontière où FP4 double les tokens par watt, les runs d’entraînement où le tissu doublé et le gain de 60 pour cent en bande passante réduisent les délais ayant une valeur commerciale, et les charges de travail déjà proches du plafond mémoire du H200. En dessous de ces seuils, l’économie Hopper l’emporte ; à ces seuils, Blackwell prend le relais.
La décision contre le Blackwell de type rack-scale. Au-dessus de cette machine se trouve la classe NVIDIA DGX GB200, où 72 GPUs partagent un domaine NVLink à l’échelle de rack. La limite est le domaine NVLink lui-même : si votre parallélisme d’entraînement nécessite plus de huit GPUs dans un tissu cohérent unique, le rack-scale est la solution, et il offre refroidissement liquide, ingénierie de centre informatique, et un engagement de niveau supérieur. Pour tout ce qui rentre dans huit Blackwell GPUs, ce qui inclut la grande majorité des formations d’entreprise et presque toutes les inférences, ce nœud délivre la même génération sans le projet d’installation.
Conformité à l’exportation et commande. Les accélérateurs Blackwell-class sont soumis aux contrôles à l’exportation américains, et MillionMiner confirme l’éligibilité des destinations dans chaque devis. Chaque système est configuré sur commande, testé, et expédié dans le monde entier DDP, avec droits et formalités douanières prises en charge. La planification du déploiement et l’hébergement dans les propres centres de données de MillionMiner sont disponibles pour les équipes qui préfèrent ne pas provisionner l’alimentation en rack à cette échelle sur site.
Le marketing générationnel est bruyant, voici donc l'étape Blackwell exprimée en chiffres. Par GPU, la mémoire passe de 141 Go avec le H200 à 180 Go de HBM3e, et la bande passante passe de 4,8 à environ 8 TB/s, soit une augmentation de 60 %. Le fabric NVLink double, passant à 1,8 TB/s par GPU contre 900 GB/s, grâce à NVSwitch en maillage complet. Par nœud, cela se traduit par 1,4 To de mémoire GPU regroupée, 64 TB/s de bande passante totale, et 144 petaFLOPS de calcul FP4. Chaque B200 est lui-même une conception à double die, deux dies limite de reticule joints à 10 TB/s et présentant comme un seul GPU avec 208 milliards de transistors.
L'histoire de la précision est aussi importante que la bande passante. Le deuxième génération du Transformer Engine de Blackwell introduit FP4 avec une mise à l'échelle micro-tensorielle, ce qui transforme les modèles de classe trillion de paramètres de problèmes de cluster en problèmes de nœud pour l'inférence. Les chiffres publiés par NVIDIA indiquent que l’inférence en temps réel HGX B200 atteint jusqu’à 15x la génération H100 sur des workloads de trillion de paramètres, avec une consommation d’énergie par token qui diminue en conséquence. Pour la formation, NVIDIA cite environ 3 fois la performance de la génération H100. Ce sont des benchmarks fournisseur et doivent être lus comme tels, mais les changements architecturaux qui les sous-tendent — FP4, fabric doublé, 60 % de mémoire en plus — sont des faits physiques.
La plateforme hôte de Gigabyte suit le rythme. Deux processeurs AMD EPYC 9005 ou 9004 de série atteignent 192 cœurs par socket pour des pipelines à forte charge de prétraitement, avec vingt-quatre modules DDR5 occupant un module par canal sur douze canaux par processeur, la configuration qui maintient toute la bande passante mémoire. Huit baies NVMe Gen5 maintiennent les ensembles de données locaux, huit emplacements PCIe à un seul slot accueillent un adaptateur de 400 Gb/s par GPU pour Quantum-2 InfiniBand ou Spectrum-X clustering, et douze alimentations Titanium de 3000W en redondance 6+6 assurent la puissance, avec refroidissement à air. Quoted en configuration et expédié dans le monde entier DDP par MillionMiner.
Nos spécialistes en minage peuvent vous aider à trouver le mineur parfait pour votre configuration et votre budget.
Voici le niveau Blackwell : huit GPUs NVIDIA B200 SXM sur la carte de base HGX, chacune équipée de 180GB de HBM3e, regroupant 1,4TB de mémoire GPU et 64 TB/s de bande passante dans un seul nœud. La fifth-generation NVLink relie chaque GPU à 1,8 TB/s via NVSwitch, doublant la fabric H200, et le second-generation Transformer Engine ajoute la précision FP4 que NVIDIA cite jusqu’à 15x d’inférence en temps réel pour des modèles à trillion de paramètres par rapport à la génération H100. Gigabyte l’accueille avec deux processeurs AMD EPYC 9005 ou 9004, vingt-quatre modules DDR5, huit baies NVMe Gen5, et douze alimentations Titanium de 3000W, refroidies à l’air. Cité et expédié dans le monde entier en DDP par MillionMiner.
Huit GPU B200 SXM à 180 Go chacun sur NVSwitch. L'inférence de classe trillion-paramètres devient un achat en un seul nœud, refroidi par air.
Moteur Transformer de deuxième génération avec mise à l'échelle micro-tensoriel. NVIDIA cite jusqu'à 15x d'inférence en temps réel par rapport à la génération H100.
NVLink de cinquième génération à 1,8 TB/s par GPU, 14,4 TB/s à travers le noeud. Synchronisation des gradients et routage MoE à deux fois la bande passante Hopper.
NVIDIA
Contactez pour le prix
Supermicro
Contactez pour le prix
Dell
Contactez pour le prix
ASUS
Contactez pour le prix
HGX B200 est le bloc de construction 8-GPU de Blackwell de NVIDIA : huit GPU B200 SXM et la toile NVSwitch les reliant, fournis à des fabricants comme Gigabyte qui conçoivent des serveurs complets autour de celui-ci. Les changements physiques par rapport à Hopper : chaque B200 est un package à double die avec 208 milliards de transistors, la mémoire passe à 180 Go de HBM3e par GPU à environ 8 To/s, NVLink double à 1,8 To/s par GPU, et le Transformer Engine de deuxième génération ajoute la précision FP4 avec mise à l’échelle micro-tensor.
1 440 Go de HBM3e regroupés, 64 To/s de bande passante mémoire globale, 144 petaFLOPS de calcul FP4, et 14,4 To/s de tissu NVLink via NVSwitch. En termes de charge de travail : ajustement précis en pleine précision de modèles de plusieurs centaines de milliards de paramètres, service FP4 en temps réel de modèles de classe trillion de paramètres, et inférence à long contexte avec une marge de cache KV au-delà de n'importe quel nœud Hopper.
Trois situations. Flottes d'inférence à l'échelle de la frontière, où FP4 double à peu près le nombre de tokens par watt et NVIDIA cite jusqu'à 15x en temps réel pour l'inférence de trillion de paramètres contre la génération H100. Programmes de formation où le tissu doublé et le gain de bande passante de 60 pour cent compressent les délais avec une valeur commerciale. Et des charges de travail qui pressent déjà le plafond de 141 Go par GPU du H200. Les équipes affinant des modèles de classe 70B ou servant dans l'enveloppe Hopper sont généralement mieux servies par les systèmes Lenovo ou ASUS HGX H200, et MillionMiner modélisera les deux dans le devis.
Utilisable, avec ingénierie. Le Transformer Engine de deuxième génération implémente la mise à l’échelle micro-tensor, en suivant l’échelle de quantification avec une granularité fine afin que les poids en quatre bits conservent la précision que la quantification naïve perd. Les stacks de service en production, y compris TensorRT-LLM, le prennent en charge, et l’inférence de grands modèles est là où cela paie : l’empreinte mémoire est réduite de moitié par rapport à FP8 et le débit double environ. La formation utilise toujours FP8 et BF16 ; FP4 est un levier d’économie pour l’inférence, et un levier important à l’échelle du parc.
Oui, c'est la prémisse d'ingénierie de cette plateforme Gigabyte : un châssis 8U avec le volume de flux d'air nécessaire pour accueillir le complexe HGX B200 complet selon les spécifications, sans refroidissement liquide direct. La conséquence pratique est la liberté de déploiement, car aucun système de distribution de liquide, plomberie ou maintenance de boucle liquide n'est requis, et tout centre de données doté d'une alimentation électrique adéquate et d'un refroidissement conventionnel est qualifié. MillionMiner confirme les exigences en flux d'air et en température d'entrée pour votre site lors du devis.
Densité du cœur et bande passante mémoire. La série EPYC 9005 atteint 192 cœurs par socket, ce qui alimente des pipelines intensifs en prétraitement pour huit GPUs de cette classe, et la plateforme dispose de douze canaux DDR5 par processeur avec les vingt-quatre modules équipés, un par canal, la configuration qui maintient toute la bande passante. Le budget des lignes PCIe Gen5 supporte également la topologie réseau un-adaptateur-par-GPU sans compromis. La série 9004 reste disponible pour les équipes qui y sont standardisées.
La frontière est le domaine NVLink. Ce nœud connecte huit GPU dans un seul tissu cohérent ; la classe GB200 connecte 72 à l’échelle d’un rack, avec refroidissement liquide et ingénierie de centre de données pour s’y adapter. Si votre parallélisme de formation nécessite réellement plus de huit GPU dans un seul domaine, l’échelle rack est la réponse. Pour tout ce qui rentre dans huit GPU Blackwell, ce qui couvre la majorité des formations d'entreprise et presque tout le service d’inférence, ce nœud offre la même génération sans le projet de centre de données, et s’étend par InfiniBand à la place.
Via la topologie un-adaptateur-par-GPU, la configuration PCIe est conçue pour : huit emplacements à un seul port prennent des adaptateurs de 400 Gb/s sur NVIDIA Quantum-2 InfiniBand ou Spectrum-X Ethernet, offrant à GPUDirect RDMA un port de tissu dédié par GPU afin que les gradients circulent entre les nœuds sans passer par le CPU. Quatre emplacements supplémentaires à double port supportent le stockage et le réseau de gestion. MillionMiner conseille sur la conception du switch et du tissu lorsqu’un déploiement dépasse une machine.
Douze alimentations de 3000W 80 PLUS Titanium en configuration redondante 6+6 définissent l'enveloppe, le complexe GPU seul pouvant tirer huit kilowatts sous charge continue avant que l'hôte ne soit compté. Il s'agit clairement d'une machine de centre de données. MillionMiner confirme la consommation exacte de votre configuration spécifiée lors du devis, et le hosting dans les propres installations de MillionMiner est disponible pour les équipes qui préfèrent ne pas approvisionner l'alimentation du rack à cette échelle.
Soumettez vos détails de charge de travail, d'échelle et de déploiement via le formulaire de devis. Un spécialiste de MillionMiner confirme la configuration, l'éligibilité de la destination conformément aux contrôles à l'exportation américains applicables aux accélérateurs de classe Blackwell, ainsi que le plan de livraison. Chaque système est testé avant l'expédition et livré dans le monde entier en DDP avec les droits et les douanes pris en charge. Des conseils pour l'intégration en rack et un déploiement hébergé sont également disponibles.