Lenovo

Lenovo NVIDIA HGX H200 141GB 700W 8-GPU Server

Modèle: ThinkSystem SR680a V3

Demandez votre devis pour le serveur

Dites-nous votre charge de travail et vos besoins de déploiement. Notre spécialiste vous répondra dans les 24 heures par e-mail, WhatsApp ou par appel.

Pourquoi ce serveur est-il indiqué en commande ?

Ces serveurs sont configurés et proposés sur devis à la commande. Votre configuration, stockage, réseau, garantie et intégration en rack déterminent le prix final, et votre destination de livraison fixe les frais d'expédition et de douane. Soumettez le formulaire ci-dessous et notre spécialiste répondra dans les 24 heures avec un devis complet incluant le matériel, la garantie et la livraison DDP dans le monde entier.

Comment fonctionne votre commande de serveur

1

Soumettre le formulaire

Partagez la charge de travail et les détails du déploiement.

2

Obtenez votre devis

Tarification complète dans les 24 heures

3

Avis avec un spécialiste

Finaliser la configuration et la livraison

4

Livraison

Expédié et prêt pour le déploiement

Authentique

Matériel testé

Dans le monde entier

Expédition mondiale

Assistance

Experts en Mining

Plateforme refroidie par air 8U de Lenovo pour la carte mère NVIDIA HGX H200 : huit GPU H200 SXM dans la classe de puissance complète de 700W, reliés par NVSwitch dans 1,1 To de HBM3e par nœud, hébergés par des processeurs Intel Xeon Scalable 5e génération doubles avec jusqu'à 2 To de mémoire TruDDR5. Capacité de formation de classe Frontier qui déploie dans un centre de données standard refroidi par air, sans retrofit de refroidissement liquide. Configuré, devisé et expédié partout dans le monde DDP par MillionMiner.

Caractéristiques complètes

Modèle ThinkSystem SR680a V3
Facteur de forme 8U Rackmount (air-cooled)
GPU Up to 8 NVIDIA H100 (80GB HBM3) or H200 (141GB HBM3e) SXM GPUs, 700W class
Mémoire GPU totale 1.1TB HBM3e (8x 141GB, H200 config)
GPU interconnexion NVSwitch full-mesh, 900 GB/s NVLink per GPU
Processeur Dual 5th Gen Intel Xeon Scalable (reference: 48C 2.3GHz; configurable)
Mémoire Up to 2TB TruDDR5 5600MHz (32x 64GB RDIMM)
Stockage Up to 16x 2.5-inch hot-swap PCIe 5.0 NVMe drives
Interfaces réseau Up to 400 Gb/s per port (GPUDirect RDMA)
Refroidissement 15x hot-swap fans, N+1 redundant (air-cooled, no liquid required)
Alimentation électrique Eight 2600W hot-swap redundant AC power supplies
Gestion Lenovo XClarity
Garantie 3-Year Warranty

Demandez un devis d'hébergement pour un Bitcoin Miner

Devis gratuit, réponse en 24h. Pas d'appel commercial.

4.4
étoile étoile étoile étoile étoile

4,7 / 5 sur Trustpilot

Avis clients vérifiés

Plus de 30 000 mineurs livrés

Expédié dans le monde entier depuis 2020

Plus de 1 200 clients dans le monde

Fiable dans plus de 50 pays

ISO Fabriqué en Allemagne trustpilot
avis-google

Obtenez un devis pour le Lenovo NVIDIA HGX H200 141GB 700W 8-GPU Server

Tarification, délai de livraison et options d'hébergement. Conseils personnalisés de notre équipe commerciale.

Répondez dans les 24h via courriel, WhatsApp ou appel.

Détails du produit

Serveur Lenovo ThinkSystem HGX H200 8-GPU : Architecture refroidie à l'air de 700W, Spécifications à l'échelle du nœud, Choix de la carte mère H100 ou H200, et la montée en gamme par rapport aux systèmes A100

Ce serveur est la plateforme Lenovo 8U refroidie par air, construite autour de la baseboard NVIDIA HGX H200 8-GPU, un hôte dual-Intel conçue spécifiquement pour que la configuration la plus puissante de la génération Hopper de NVIDIA puisse fonctionner dans un centre de données ordinaire refroidi par air. Sur un marché où les nœuds H200 full-power adoptent de plus en plus la refroidissement liquide, cette décision d'ingénierie unique définit la cible de cette machine : les organisations souhaitant une capacité de formation de génération actuelle sans reconstruire leur installation pour l’obtenir.

Le complexe GPU. Huit NVIDIA H200 SXM GPUs de la classe puissance de 700W sont montés sur la baseboard HGX et interconnectés via NVSwitch en pleine mosaïque, chaque GPU pouvant atteindre tous les autres GPU à 900 GB/s sans toucher le CPU ni le chemin PCIe. Chaque GPU possède 141GB de HBM3e, la première deployment HBM3e de la gamme NVIDIA, offrant au nœud 1 128GB de mémoire GPU pooling et un débit total proche de 38 TB/s. La capacité FP8 avec le Transformer Engine dépasse 30 petaFLOPS par nœud. En termes de charge de travail : des modèles de 70 milliards de paramètres peuvent être fine-tunés en FP16 pleine précision en une seule machine, les inférences à long contexte bénéficient de la mémoire cache KV qui dépasse les 80GB que peuvent offrir les GPU classiques, et les architectures Mixture-of-Experts routent entre experts à la vitesse NVLink. Chaque H200 peut également se partitionner en jusqu’à sept instances MIG de 16,5GB, permettant à un seul serveur de présenter plus de cinquante slices GPU isolés matériellement pour la multi-location.

L'ingénierie thermique, qui est la raison de choisir cette coque. Huit GPUs de 700W plus deux CPU de serveur génèrent une chaleur d’un montant à quatre chiffres en watts dans un seul boîtier. La conception de Lenovo y répond avec 8U de volume d’air et quinze ventilateurs hot-swap dans une configuration redondante N+1, maintenant la baseboard à pleine puissance selon les spécifications en simple refroidissement par air. La conséquence pratique est grande : pas d’unités de distribution de liquide, pas de plomberie de centre de données, pas de contrats de maintenance de boucle liquide, et aucune contrainte pour la minorité des centres de données déjà équipés pour le refroidissement liquide direct. La puissance est adaptée selon la même norme : huit alimentations redondantes hot-swap de 2600W offrent une marge de sécurité, puisant dans la distribution électrique AC standard du data center.

La plateforme hôte. Deux processeurs Intel Xeon Scalable de 5e génération constituent l'ancrage du nœud, avec des configurations dans la classe 48 cœurs par socket. Trente-deux slots DIMM supportent la mémoire TruDDR5 à 5600MHz jusqu’à 2TB, ce qui est important car la règle de base pour un nœud de formation est une mémoire système équivalente ou supérieure à la mémoire GPU totale, et 2TB sur une pool GPU de 1,1TB le dépasse correctement. Le stockage utilise seize baies NVMe PCIe 5.0 hot-swap de 2,5 pouces, offrant une capacité locale suffisante pour que la plupart des travaux de formation ne nécessitent pas d’accéder aux données à travers le réseau. La connectivité atteint 400 Gb/s par port, supportant la topologie un-adaptateur-par-GPU que nécessite le clustering GPUDirect RDMA lorsque plusieurs nœuds travaillent ensemble.

Une seule coque, deux générations. La plateforme peut accueillir soit la baseboard HGX H200, soit la baseboard HGX H100 avec GPU HBM3 de 80GB. Cette flexibilité constitue un levier d’approvisionnement réel : les équipes dont les modèles tiennent aisément dans 640GB par nœud peuvent opter pour le H100 et faire la différence, tandis que celles qui poussent les limites de mémoire choisissent le H200 de 141GB. MillionMiner cite les deux configurations sur cette plateforme.

Sa place dans ce catalogue, expliquée simplement. Les trois systèmes 8x A100 ici, le DGX A100, le Supermicro AS-4124GO-NART+ et l’Exeton Quasar 640X, offrent une formation NVSwitch éprouvée à des coûts accessibles, 640GB par nœud. Cette plateforme Lenovo constitue la progression générationnelle : 76 % de mémoire GPU en plus, 43 % de bande passante par GPU en plus, le throughput FP8 du Transformer Engine que la génération Ampere ne possède pas, et NVLink à 900 GB/s contre 600. Le profil d’acheteur visé est l’équipe dont les charges de travail ont dépassé la mémoire A100 ou dont les délais de formation justifient la capacité Hopper. Par rapport au NVIDIA DGX H200, c’est la voie OEM : un hôte configurable, l’organisation mondiale de service de Lenovo et XClarity en support, et trois ans de garantie, sans la prime sur le boîtier NVIDIA. Par rapport au système ASUS HGX H200 également dans ce catalogue, le cas Lenovo est celui de la standardisation de flotte d’entreprise : les organisations déjà équipées d’une infrastructure serveur Lenovo conservent un seul plan de gestion, une seule relation de support, et un seul manuel opérationnel.

Chaque unité est cotée selon la configuration, testée, et livrée dans le monde entier en DDP, avec les droits et formalités douanières gérés. La planification du déploiement et l’hébergement dans les centres de données de MillionMiner sont disponibles pour les équipes qui préfèrent ne pas provisionner environ dix kilowatts de puissance rack sur site.

Lenovo HGX H200 Server : Capacité de Formation Frontier Votre Centre de Données Existants Peut En Fait Refroidir

La décision qui retarde la plupart des déploiements de H200 n'est pas le budget. C'est l'infrastructure. Le H200 SXM dans sa classe de puissance complète de 700W génère environ 5 600W de chaleur GPU dans un seul châssis, et une grande partie du marché y répond par un refroidissement liquide direct, ce qui implique plomberie, distribution du liquide de refroidissement, et une rénovation des installations avant la première séance d'entraînement. La réponse de Lenovo dans cette plateforme est différente : un châssis 8U avec quinze ventilateurs N+1 à échange à chaud et le volume thermique pour faire fonctionner la carte de base HGX H200 en air standard. Si votre centre de données dispose d'une alimentation électrique et d'un refroidissement conventionnel, il peut héberger cette machine.

Ce que le nœud fournit une fois installé en rack. Huit GPU NVIDIA H200 SXM dotés chacun de 141GB de HBM3e, soit 1 128GB au total, avec NVSwitch connectant chaque GPU à tous les autres à 900 GB/s. C'est le réseau qui permet à huit GPUs d'entraîner comme une seule grande machine : la synchronisation des gradients reste totalement hors du PCIe bus, et la montée en charge reste proche de linéaire. La bande passante mémoire aggregate approche 38 TB/s, avec un débit FP8 Transformer Engine supérieur à 30 petaFLOPS par nœud.

Le côté hôte est dimensionné pour alimenter ces GPUs. Deux processeurs Intel Xeon Scalable de 5e génération gèrent la pré-traitement et le chargement des données. Jusqu’à 2TB de mémoire TruDDR5 5600MHz repose confortablement au-dessus de la piscine GPU de 1,1TB, respectant la règle de la mémoire système que les hôtes sous-dimensionnés violent. Seize emplacements NVMe PCIe 5.0 à échange à chaud permettent de garder les ensembles de données locaux à pleine vitesse, et une connectivité réseau pouvant atteindre 400 Gb/s par port supporte une carte réseau par GPU pour le GPUDirect RDMA multi-nœuds. Le même châssis accepte également la carte de base HGX H100, permettant ainsi à l'acheteur de choisir la génération qui correspond à la charge de travail. Quotation et livraison mondiale DDP par MillionMiner.

Besoin d'aide pour choisir ?

Nos spécialistes en minage peuvent vous aider à trouver le mineur parfait pour votre configuration et votre budget.

Lenovo HGX H200 : 8x GPU SXM 700W, refroidis par air

Ceci est la plateforme Lenovo pour la baseboard NVIDIA HGX H200 8-GPU, et sa caractéristique principale est thermique : huit GPU SXM H200 à la gamme de puissance complète de 700W, connectés via NVSwitch à 900 GB/s chacun, refroidis entièrement par air. Le nœud regroupe 1,1 To de mémoire GPU HBM3e derrière deux processeurs Intel Xeon Scalable de 5e génération, jusqu'à 2 To de mémoire TruDDR5 à 5600MHz, seize baies NVMe PCIe 5.0 en hot-swap, et un réseau atteignant jusqu'à 400 Gb/s par port pour le clustering GPUDirect RDMA. Huit alimentations redondantes de 2600W et quinze ventilateurs N+1 assurent son refroidissement. Formation Frontier sans retrofit de refroidissement liquide, provenant d'un OEM de premier plan.

8x 700W H200, refroidis par air

Quinze ventilateurs N+1 et 8U de volume thermique font fonctionner la carte mère HGX H200 en plein régime sans refroidissement liquide. Aucun retrofit d'installation, pas de plomberie, pas de CDU.

1.1 To de HBM3e derrière NVSwitch

Huit GPU H200 SXM à 141 Go chacun, chaque GPU relié à 900 Go/s. Affiner des modèles 70B en FP16 complet à l'intérieur d'un seul nœud.

Fabricant OEM de premier plan, carte mère H100 ou H200

Un châssis Lenovo accepte l'une ou l'autre base Hopper. Gestion XClarity, couverture de service globale, et un hôte configurable derrière les GPUs.

Foire aux questions

Questions fréquemment posées

L'ensemble de spécifications, un châssis refroidi par air de 8U avec deux processeurs Intel Xeon Scalable de 5ème génération, une mémoire TruDDR5, quinze ventilateurs N+1, et huit alimentations de 2600W équipant une carte mère HGX H100 ou H200, définit cette plateforme GPU Lenovo refroidie par air de 8U. MillionMiner confirme la désignation exacte du modèle Lenovo et la configuration sur votre devis, car Lenovo propose cette solution GPU en variantes refroidies par air pour Intel, refroidies par air pour AMD, et refroidies par liquide.

Le châssis accepte soit une baseboard, et la décision dépend de la mémoire. L'H100 dispose de 80GB de HBM3 par GPU, 640GB par nœud, et reste excellent pour les modèles qui tiennent dedans. L'H200 possède 141GB de HBM3e par GPU, 1.1TB par nœud, avec 43 pour cent de bande passante en plus, et justifie son prix lorsque vous ajustez en finesse des modèles de classe 70B en pleine précision, servez des inférences à long contexte, ou exécutez des travaux memory-bound Mixture-of-Experts. Si vos charges de travail utilisent déjà toute la capacité de 80GB des GPUs, l'H200 est la solution ; sinon, la configuration H100 compense la différence.

Oui, et c'est l'ingénierie caractéristique de la plateforme. Quinze ventilateurs hot-swap en configuration redondante N+1 déplacent de l'air à travers 8U de volume de châssis, maintenant la carte de base HGX à pleine puissance selon les spécifications sans refroidissement liquide direct. La signification pratique : tout centre de données disposant d'une alimentation suffisante et d'un refroidissement conventionnel peut héberger cette machine, sans unités de distribution de liquide, plomberie ou maintenance de boucle liquide.

1 128GB de HBM3e regroupés sur huit GPUs, une bande passante mémoire agrégée approchant 38 To/s, un débit du FP8 Transformer Engine dépassant 30 pétaFLOPS, et NVLink à 900 GB/s entre chaque paire de GPU via NVSwitch. En termes de charge de travail : un ajustement précis en pleine précision de modèles de 70 milliards de paramètres au sein d’un seul nœud, une inférence à contexte long avec une réelle capacité de cache KV, et jusqu’à sept partitions MIG par GPU pour un service multi-locataires.

Même classe de complexe GPU : huit GPU H200 SXM sur une carte mère NVSwitch. Le DGX est l'appareil scellé de NVIDIA avec sa pile logicielle et un support mono-fournisseur à un coût d'appareil. Cette plateforme Lenovo est la voie OEM : un hôte configurable avec votre choix de mémoire, stockage, et réseau, le service mondial de Lenovo et la gestion XClarity derrière, généralement à un coût de plateforme significativement inférieur. Les acheteurs orientés certitude penchent vers le DGX ; les entreprises axées sur la flotte et la valeur se tournent ici.

Les deux utilisent la même carte mère hybride NVIDIA HGX H200 8-GPU, donc la performance du GPU est équivalente. La décision porte sur l'hôte et la relation avec le fournisseur. Le cas Lenovo concerne la standardisation en entreprise : les organisations déjà en train de gérer des parcs de serveurs Lenovo conservent une seule plateforme de gestion, un seul contrat de support, et une seule stratégie de pièces de rechange. MillionMiner cite les deux et recommandera en fonction de votre infrastructure existante plutôt que par préférence.

Lorsque la mémoire ou le débit deviennent la contrainte. Les systèmes A100 offrent 640 Go par nœud et restent la solution de valeur pour le fine-tuning et le serving dans cette enveloppe. Le nœud H200 contient 1,1 To, soit 76 % de mémoire en plus et 43 % de bande passante par GPU en plus, sans parler du débit FP8 Transformer Engine que la génération Ampere ne possède pas. Les équipes entraînant des modèles plus grands, servant des contextes plus longs ou compressant les délais de formation sont celles pour qui cette étape en vaut la peine.

Oui. La connectivité peut atteindre 400 Gb/s par port, prenant en charge la topologie un-adaptateur-par-GPU requise par GPUDirect RDMA, où les GPU dans différents nœuds échangent directement des gradients via le fabric sans involvement du CPU. Seize baies NVMe locales conservent les ensembles de données sur le nœud, et MillionMiner conseille sur la conception du fabric et des commutateurs lorsqu'un déploiement dépasse une machine.

Il s'agit d'une machine d'environ dix kilowatts : huit alimentations redondantes hot-swap de 2600W alimentent huit GPU de 700W ainsi que l'hôte à double CPU, dans une empreinte rack de 8U avec un flux d'air frontal vers arrière à volume élevé. Elle nécessite une distribution d'énergie en centre de données mais pas de refroidissement liquide, ce qui constitue précisément son avantage. MillionMiner confirme le plan d'alimentation et de thermique pour votre site lors de la configuration, et l'hébergement dans les propres installations de MillionMiner est disponible en alternative.

Soumettez votre charge de travail, votre préférence pour la génération de GPU, et les détails de déploiement via le formulaire de devis. un spécialiste de MillionMiner confirme la configuration, la mémoire hôte, le stockage, le réseau, et la couverture de garantie de trois ans, puis le système est testé et expédié dans le monde entier DDP avec les droits et la douane pris en charge avant la livraison. Des conseils pour l'intégration en rack et le déploiement hébergé sont également disponibles.