Supermicro
Modèle: SYS-821GE-TNHR
Supermicro's 8U SuperServer construit autour de la baseboard NVIDIA HGX H800 8-GPU : huit GPUs H800 SXM avec 640GB de HBM3 combinés, une puissance de traitement complète du Hopper FP8 Transformer Engine, et une interconnexion NVSwitch, hébergé par des processeurs Intel Xeon Scalable doubles avec jusqu'à 8TB de mémoire DDR5. La puissance de calcul de la génération Hopper qui a entraîné des modèles de pointe, sur une plateforme Supermicro avec refroidissement par air ou liquide en option. Quotation et livraison dans le monde entier en DDP par MillionMiner.
Demandez votre devis pour le serveur
Dites-nous votre charge de travail et vos besoins de déploiement. Notre spécialiste vous répondra dans les 24 heures par e-mail, WhatsApp ou par appel.
Pourquoi ce serveur est-il indiqué en commande ?
Ces serveurs sont configurés et proposés sur devis à la commande. Votre configuration, stockage, réseau, garantie et intégration en rack déterminent le prix final, et votre destination de livraison fixe les frais d'expédition et de douane. Soumettez le formulaire ci-dessous et notre spécialiste répondra dans les 24 heures avec un devis complet incluant le matériel, la garantie et la livraison DDP dans le monde entier.
Merci ! Notre spécialiste vous répondra dans les 24 heures avec votre devis personnalisé.
Comment fonctionne votre commande de serveur
Soumettre le formulaire
Partagez la charge de travail et les détails du déploiement.
Obtenez votre devis
Tarification complète dans les 24 heures
Avis avec un spécialiste
Finaliser la configuration et la livraison
Livraison
Expédié et prêt pour le déploiement
Authentique
Matériel testé
Dans le monde entier
Expédition mondiale
Assistance
Experts en Mining
Tarification, délai de livraison et options d'hébergement. Conseils personnalisés de notre équipe commerciale.
Tarification, délai de livraison et options d'hébergement. Conseils personnalisés de notre équipe commerciale.
La plupart des informations que les acheteurs lisent sur le H800 sont soit dismissives, soit évasives. La version précise est plus utile : le H800 est la variante conforme à l'export du H100, construit sur le même silicon Hopper, et la question de savoir s'il convient à votre déploiement a une réponse claire une fois que vous savez quelles deux spécifications ont été modifiées et si votre charge de travail y touche.
Ce qui est identique au H100. La puce GPU, les 80 Go de mémoire HBM3 en bande passante complète, les Tensor Cores de quatrième génération, et toute la pile de précision que le travail AI utilise réellement : FP8 via le Transformer Engine, BF16, FP16, et TF32. Un nœud à huit GPUs offre 640 Go de HBM3 pooling, un bande passante mémoire agrégée supérieur à 26 To/s, et un débit FP8 dans la même catégorie qu’un nœud H100, dépassant 30 petaFLOPS. La partition MIG est également intacte, jusqu’à sept instances isolées par GPU, donc un seul serveur peut présenter plus de cinquante tranches matérielles partitionnées pour l’inférence multi-locataires.
Ce qui a été réduit, et quand cela compte. Tout d’abord, NVLink : 400 GB/s par GPU au lieu de 900. À l’intérieur d’un seul nœud, NVSwitch connecte toujours les huit GPUs dans une maille complète, et 400 GB/s reste plus de trois fois la bande passante PCIe Gen 5, donc la formation, le fine-tuning et l’inférence en nœud unique sont à peine affectés. La réduction s’attaque à l’échelle multi-nœuds frontalière, où la synchronisation des gradients à travers des dizaines de nœuds dépend de chaque gigaoctet de bande passante du fabric. Deuxièmement, FP64 : réduction drastique, ce qui disqualifie le H800 pour la simulation scientifique en double précision. La formation AI n’utilise pas FP64. Si votre travail concerne la dynamique des fluides numériques ou la modélisation climatique, achetez un système H100 ; si ce sont des modèles de langage, la vision ou la recommandation, cette réduction est sans importance pour vous.
Le point de preuve, officiellement. DeepSeek a entraîné V3 et R1 sur des clusters H800 et a publié l’ingénierie. Une stratégie de parallélisme discipliné sur ce GPU précis a produit des modèles compétitifs à l’échelle mondiale. Cela ne fait pas disparaître la réduction NVLink ; cela montre que la puissance de calcul, la mémoire et le débit FP8 du H800 sont véritablement de classe frontalière, et que la contrainte est une considération d’ingénierie plutôt qu’un plafond.
L’hôte Supermicro. Il s’agit d’un SuperServer 8U avec deux processeurs Intel Xeon Scalable sur LGA-4677, jusqu’à 64 cœurs et 128 threads par socket. La mémoire s’étend jusqu’à 8 To de DDR5 ECC répartis sur 32 emplacements DIMM, dépassant largement la règle selon laquelle la mémoire du système doit être supérieure à la mémoire GPU, et laissant de la place pour le prétraitement en mémoire que querivent les pipelines de grands ensembles de données. Le stockage comprend douze baies NVMe échangeables à chaud et trois baies SATA pour la capacité, avec deux emplacements M.2 pour maintenir le système d’exploitation hors du chemin de l’ensemble de données. La connectivité réseau comprend deux ports 10GbE intégrés et une option 25GbE, avec une expansion PCIe pour ajouter des adaptateurs fabric pour GPUDirect RDMA lorsque le déploiement dépasse un seul nœud. L’alimentation se compose de six alimentations redondantes de 3000W ; le refroidissement comprend dix ventilateurs haute puissance, avec un refroidissement liquide direct disponible en option pour les sites denses en nœuds. La pile de gestion de Supermicro, SuperCloud Composer et Supermicro Server Manager, gère l’exploitation de la flotte, avec TPM 2.0 et Silicon Root of Trust en sous-couche.
Sa place dans ce catalogue. Face aux trois systèmes A100, le DGX A100, le Supermicro AS-4124GO-NART+ et le Exeton Quasar 640X, ce nœud est une génération complète en avance là où cela compte : débit Transformer Engine FP8 que la génération Ampere ne possède pas, HBM3 contre HBM2e, et les mêmes 640 Go par nœud. Face aux systèmes H100 et H200, les plateformes Lenovo et ASUS HGX, le H800 représente la position de valeur dans la génération Hopper : performance en nœud unique dans la même classe, avec les réductions NVLink et FP64 intégrées en prix. L’acheteur auquel il convient exécute la formation, le fine-tuning ou l’inférence à une échelle d’un ou quelques nœuds et souhaite que l’économie Hopper le reflète. L’acheteur auquel il ne convient pas exécute la simulation FP64 ou la formation multi-nœuds à l’échelle d’un cluster, et MillionMiner le dira dans la conversation de devis plutôt qu’après la livraison.
Note de conformité à l’export : le H800 est soumis aux contrôles d’exportation américains, et MillionMiner confirme l’éligibilité de la destination dans chaque devis. Chaque système est configuré sur commande, testé, et expédié mondialement DDP, avec droits et douanes gérés. L’hébergement dans les propres centres de données de MillionMiner est disponible pour les équipes préférant ne pas prévoir dix kilowatts de puissance rack sur site.
Le H800 mérite une introduction plus sincère que ce qu'il reçoit habituellement. Il ne s'agit pas d'une version allégée ou d'un simple accessoire. C'est du silicium H100 : la même architecture Hopper, les mêmes 80 GB de HBM3 à la pleine bande passante mémoire, les mêmes Tensor Cores de quatrième génération et le Transformer Engine FP8 qui définissent cette génération de GPU. Deux éléments ont été réduits pour la conformité à l'exportation : la bande passante NVLink, passant de 900 à 400 GB/s par GPU, et le débit FP64, qui est important pour la simulation scientifique et presque rien d'autre en IA. Tout ce qu'une course d'entraînement ou une flotte d'inférence utilise réellement, FP8, BF16, TF32 compute et bande passante HBM3, est intact.
La preuve est publique. DeepSeek a entraîné V3 et R1, des modèles qui ont modifié la conversation mondiale sur l'IA, sur des clusters composés exactement de ce GPU. La réduction NVLink est réelle, et elle se manifeste dans la synchronisation des gradients multi-noeuds à grande échelle de cluster. Au sein d'un seul noeud, où NVSwitch connecte encore les huit GPU en un maillage complet, le fine-tuning, l'entraînement et l'inférence fonctionnent au rythme Hopper.
La plateforme Supermicro autour de la carte mère est dimensionnée généreusement. Deux processeurs Intel Xeon Scalable avec jusqu'à 64 cœurs chacun gèrent la préprocessing et le chargement des données. Trente-deux slots DIMM peuvent atteindre 8 TB de DDR5 ECC, un ordre de grandeur supérieur au pool GPU de 640 GB et bien au-delà de la règle de dimensionnement que violent les hôtes sous-dimensionnés. Douze baies NVMe plus trois baies SATA maintiennent les ensembles de données locaux, deux slots M.2 isolent le chemin de démarrage, et six alimentations redondantes de 3000W supportent l'enveloppe d'environ dix kilowatts. Dix ventilateurs robustes gèrent tout cela en air, avec refroidissement liquide disponible pour les déploiements en rack dense. Délivré en configuration et expédié dans le monde entier DDP par MillionMiner.
Nos spécialistes en minage peuvent vous aider à trouver le mineur parfait pour votre configuration et votre budget.
Le H800 est le GPU qui a prouvé un point : DeepSeek a entraîné ses modèles frontier V3 et R1 sur des clusters H800, utilisant le même silicium Hopper, 80GB de HBM3, et le FP8 Transformer Engine que le H100. Ce Supermicro SuperServer 8U héberge huit d’entre eux sur une carte mère NVSwitch, avec 640GB de mémoire GPU par nœud, derrière des processeurs Intel Xeon Scalable doublés, jusqu’à 8TB de DDR5 répartis sur 32 emplacements DIMM, douze baies NVMe, et six alimentations redondantes de 3000W. Dix ventilateurs robustes le refroidissent par air, avec un refroidissement liquide en option. Formation et inférence de classe Hopper, cotées et expédiées dans le monde entier en DDP par MillionMiner.
Les clusters H800 ont permis de former DeepSeek V3 et R1. Même silicium Hopper, 80GB HBM3, et FP8 Transformer Engine que le H100, prouvé à la frontière.
Huit GPU H800 SXM sur NVSwitch offrent plus de 30 pétaFLOPS en FP8 et 26 To/s de bande passante mémoire agrégée. MIG divise chaque GPU en sept parties.
Jusqu'à 8TB DDR5 répartis sur 32 DIMMs, douze baies NVMe, six alimentations redondantes de 3000W, dix ventilateurs à air avec refroidissement liquide en option.
NVIDIA
Contactez pour le prix
Supermicro
Contactez pour le prix
Dell
Contactez pour le prix
ASUS
Contactez pour le prix
Le H800 est la version conforme à l'exportation du H100, construite sur un silicium Hopper identique avec les mêmes 80GB de HBM3 à pleine bande passante et le même FP8 Transformer Engine. Deux spécifications ont été réduites : la bande passante NVLink, 400 GB/s par GPU au lieu de 900, et le débit FP64, utilisé par les simulations scientifiques plutôt que par l'IA. Pour la formation, le fine-tuning et l'inférence, la puissance de calcul et la mémoire que vous utilisez correspondent à celles du H100.
Le registre public répond à cela. DeepSeek a formé V3 et R1, des modèles frontier par tous les critères, sur des clusters H800 et a publié la conception technique derrière cela. Le débit FP8 du GPU, la bande passante HBM3, et l'architecture Tensor Core sont de classe H100 car ils utilisent le même silicium. La réduction NVLink est une considération d'ingénierie à l’échelle multi-noeud, et non un plafond de performance.
À l’échelle d’un cluster multi-noeud. À l’intérieur d’un serveur, NVSwitch continue de relier les huit GPU dans un maillage complet à 400 GB/s chacun, soit plus de trois fois la vitesse PCIe Gen 5, donc la formation et le fine-tuning sur un seul nœud sont à peine affectés. La synchronisation des gradients entre des dizaines de nœuds est le domaine où l’écart face au tissu H100 à 900 GB/s se creuse. Les acheteurs utilisant un ou quelques nœuds ne le ressentent que rarement ; ceux qui prévoient de grands clusters devraient considérer les systèmes H100 et H200 dans ce catalogue, et MillionMiner modélisera les deux dans le devis.
Pas si le travail est en double précision. Le débit FP64 de l'H800 a été réduit de manière drastique dans le cadre des conformités à l'exportation, ce qui le disqualifie pour la dynamique des fluides computationnelle, la modélisation climatique et des charges de travail FP64 similaires. Pour ces applications, les systèmes H100 et H200 de ce catalogue maintiennent toute la performance en Tensor FP64. Pour la formation et l'inférence AI, qui utilisent FP8, BF16 et TF32, la réduction ne pose pas d'obstacle.
Huit GPU H800 SXM avec 640 Go de HBM3 regroupé, une bande passante mémoire agrégée supérieure à 26 To/s, un débit FP8 Transformer Engine supérieur à 30 petaFLOPS, et une interconnexion NVSwitch en maillage complet. Chaque GPU se divise en jusqu'à sept instances MIG, de sorte que le nœud peut présenter plus de cinquante slices GPU isolés matériellement pour le service d'inférence multi-locataires.
Processeurs Dual Intel Xeon Scalable sur LGA-4677, jusqu'à 64 cores et 128 threads par socket, avec 32 emplacements DIMM pouvant atteindre 8TB de ECC DDR5. Le stockage comprend douze baies NVMe hot-swap plus trois baies SATA, avec deux emplacements M.2 permettant de maintenir le chemin de démarrage séparé de l'I/O des données. Le réseau est équipé en standard de deux ports 10GbE intégrés, avec une option 25GbE, et une expansion PCIe pour les adaptateurs de fabrics. Supermicro's SuperCloud Composer et Server Manager gèrent la gestion de flotte, avec TPM 2.0 et Silicon Root of Trust pour la sécurité de la plateforme.
Non. Dix ventilateurs industriels refroidissent le nœud avec de l'air standard de centre de données, ce qui permet un déploiement à l'intérieur de structures ordinaires. Le refroidissement liquide direct est disponible en option pour les sites où les nœuds sont installés à une densité élevée en racks, et MillionMiner conseille sur la configuration adaptée à votre installation lors du devis.
C'est une génération entière d'avance où les charges de travail AI se remarquent. Le Hopper FP8 Transformer Engine double approximativement le débit d'entraînement effectif par rapport à Ampere avec la même mémoire de nœud, HBM3 dépasse la HBM2e de l'A100, et la bande passante NVSwitch par GPU est comparable au tissu de 600 Go/s de l'A100. Tous deux offrent 640 Go par nœud. Les équipes choisissant entre eux pèsent l'économie d'Ampere contre le débit de Hopper, et MillionMiner cite honnêtement les deux.
Les performances en single-node se situent dans la même catégorie qu'un système H100, puisque le silicium, la mémoire et le débit FP8 sont équivalents. Les plateformes H100 et H200 justifient leur position avec un full NVLink à 900 GB/s pour la scalabilité multi-noeuds, un FP64 complet pour le HPC, et dans le cas du H200, 141 GB de HBM3e par GPU. Le H800 représente la valeur sûre dans la génération Hopper pour les déploiements AI à un ou quelques noeuds. Si vous le dépassez, le chemin de l'upgrade est déjà dans ce catalogue.
Soumettez votre charge de travail et vos détails de déploiement via le formulaire de devis, et un spécialiste de MillionMiner confirme la configuration, l'éligibilité de la destination selon les contrôles à l'exportation des États-Unis applicables au H800, ainsi que le plan de livraison. Chaque système est testé avant l'expédition et livré partout dans le monde DDP avec les droits et les formalités douanières prises en charge. L'hébergement dans les propres centres de données de MillionMiner est disponible en alternative au déploiement sur site.