NVIDIA

Nvidia H100 NVL (94GB) AI and HPC GPU

Μοντέλο: H100 NVL

Ζητήστε την Προσφορά για το GPU Cluster σας

Ενημερώστε μας σχετικά με τις απαιτήσεις υλοποίησής σας. Ο ειδικός υλικού AI μας απαντά εντός 24 ωρών μέσω email, WhatsApp ή τηλεφώνου.

Γιατί οι GPUs πωλούνται με συμβουλευτική

Οι συστοιχίες GPU για φόρτο εργασίας AI και HPC διαμορφώνονται ακριβώς σύμφωνα με τις απαιτήσεις σας — ποσότητα, τοπολογία διασύνδεσης, κατανάλωση ισχύος και ψύξη επηρεάζουν το τελικό κόστος. Υποβάλετε τη φόρμα παρακάτω και ο ειδικός μας θα απαντήσει εντός 24 ωρών με μια ολοκληρωμένη προσφορά προσαρμοσμένη στην υλοποίησή σας.

Πώς λειτουργεί η παραγγελία του GPU σας

1

Υποβάλετε τη φόρμα

Πείτε μας τη χρήση και την ποσότητα σας

2

Λάβετε την προσφορά σας

Ολοκληρωμένη τιμολόγηση εντός 24 ωρών

3

Ανασκόπηση με ειδικό

Συζητήστε για τη διαμόρφωση, τη διασύνδεση και την ψύξη

4

Ανάπτυξη

Υλικό αποστολείται & έτοιμο για λειτουργία

Αυθεντικό

Δοκιμασμένο υλικό

Παγκοσμίως

Παγκόσμια αποστολή

Υποστήριξη

Ειδικοί στην εξόρυξη

Δύο κάρτες NVIDIA H100 PCIe συνδεδεμένες μέσω 3x NVLink bridges σε μια ενιαία μνήμη HBM3 των 94GB με συνολική διαύγεια 3,938 GB/s. Αρχιτεκτονική Hopper με τέταρνης γενιάς Tensor Cores και FP8 Transformer Engine. 14.592 CUDA cores ανά κάρτα, TDP 400W ανά κάρτα. PCIe Gen 5 x16. MIG έως και 7 instances ανά κάρτα. Κατασκευασμένο για LLM inference όπου τα μοντέλα υπερβαίνουν τη χωρητικότητα 80GB σε single-GPU. Ταιριάζει σε τυπικές πλατφόρμες server PCIe χωρίς HGX baseboard. Αθόρυβος ψύκτης για το κουτί του server. Επικοινωνήστε με MillionMiner για τιμές.

Πλήρεις προδιαγραφές

Μοντέλο H100 NVL

Ζητήστε μια προσφορά φιλοξενίας Bitcoin Miner

Δωρεάν προσφορά, απάντηση σε 24ωρα. Χωρίς τηλεφωνική πώληση.

4.4
αστέρας αστέρας αστέρας αστέρας αστέρας

4.7 / 5 στο Trustpilot

Επαληθευμένες κριτικές πελατών

Πάνω από 30.000 miners παραδόθηκαν

Αποστάλθηκε παγκοσμίως από το 2020

1,200+ πελάτες παγκοσμίως

Αξιόπιστο σε 50+ χώρες

ISO made-in-Γερμανία trustpilot
google-κριτική

Ζητήστε μια Προσφορά για το Nvidia H100 NVL (94GB) AI and HPC GPU

Τιμές, χρόνος παράδοσης και επιλογές hosting. Προσωπικές συμβουλές από την ομάδα πωλήσεών μας.

Απαντήστε εντός 24 ωρών μέσω email, WhatsApp, ή τηλεφώνημα.

Λεπτομέρειες προϊόντος

NVIDIA H100 NVL 94GB PCIe Tensor Core GPU: Αρχιτεκτονική Ζεύγους NVLink, Λειτουργία Inference LLM και Οδηγός Ανάπτυξης

Το H100 NVL είναι η απάντηση της NVIDIA στο πρόβλημα οροφής των 80GB στη δική τους σειρά H100. Το H100 SXM προσφέρει 80GB ανά κάρτα σε μια βάση HGX, η οποία προηγείται στον κλάδο για εκπαίδευση. Αλλά για inference σε μοντέλα πάνω από 70B παραμέτρους με FP16 (αποτύπωμα μνήμης άνω των 140GB), μια μόνο κάρτα των 80GB υστερεί. Το NVL λύνει αυτό το πρόβλημα κρατώντας δύο PCIe H100 κάρτες μέσω τριών NVLink bridges σε μια ενιαία ομάδα 94GB HBM3, την οποία το λογισμικό αναγνωρίζει ως έναν ενιαίο χώρο μνήμης. Αρχιτεκτονική ανά κάρτα: GH100 GPU στην TSMC 4nm με 14.592 CUDA cores (132 SMs από τα 144 ενεργά), 456 τέταρτης γενιάς Tensor Cores που υποστηρίζουν FP64, TF32, FP16, BF16, FP8 και INT8 ακρίβεια με το Transformer Engine που επιλέγει δυναμικά την βέλτιστη ακρίβεια ανά στρώση κατά τη διάρκεια inference. 47GB HBM3 ανά κάρτα με περίπου 1.979 GB/s εύρος ζώνης. Για το ζεύγος NVLink: 94GB ενιαία μνήμη με συνολικό εύρος 3.938 GB/s, συνδεδεμένο με NVLink 600 GB/s διπλής κατεύθυνσης ανάμεσα στις δύο κάρτες. Το Transformer Engine είναι το χαρακτηριστικό που διακρίνει το H100 σε σύγκριση με το A100. Διαχειρίζεται αυτόματα τους μικτούς υπολογισμούς ακρίβειας FP8 και FP16 ανά στρώση νευρωνικού δικτύου, επιφέροντας έως 4 φορές μεγαλύτερη μέσω εκπαίδευσης και 30 φορές μεγαλύτερη μέσω inference σε μοντέλα βασισμένα σε transformer σε σύγκριση με το A100. Η παραγωγική εξυπηρέτηση LLM με ζεύγη H100 NVL παράγει 2x έως 3x περισσότερα tokens ανά δευτερόλεπτο ανά δολάριο σε σύγκριση με τις 80GB υλοποιήσεις A100 για μοντέλα από 30B έως 70B παραμέτρους. Το TDP είναι 400W ανά κάρτα ως η προεπιλεγμένη λειτουργία, με το καλώδιο PCIe 16-pin να υποστηρίζει διαμορφώσεις από 200W έως 600W ανά κάρτα. Στην προεπιλεγμένη κατάσταση των 400W ανά ζεύγος (800W συνολικά), το ζεύγος NVL καταναλώνει περίπου την ίδια ενέργεια με μια H100 SXM στα 700W, αλλά προσφέρει 94GB έναντι 80GB με την απλούστερη υποδοχή PCIe. Η λειτουργία MIG δημιουργεί έως και 7 πλήρως απομονωμένες μονάδες ανά κάρτα (14 συνολικά στο ζεύγος) με αποκλειστική μνήμη, cache και υπολογιστική ισχύ. Για την εξυπηρέτηση πολλαπλών πελατών, αυτή η λεπτομέρεια είναι πολύτιμη: εξυπηρετεί διαφορετικούς πελάτες ή μοντέλα σε απομονωμένες GPU slices με εγγυημένη QoS. Το NVL ταιριάζει σε τυπικές πλατφόρμες server PCIe. Οποιοσδήποτε server με δύο γειτονικές υποδοχές PCIe Gen 5 x16, φυσικό χώρο για τη συναρμολόγηση του NVLink (τρεις bridges που καλύπτουν και τις δύο κάρτες), και επαρκή κυκλοφορία αέρα για περαιτέρω ψύξη 800W. Οι πλατφόρμες Supermicro, Dell PowerEdge, HPE ProLiant και Lenovo ThinkSystem όλα τεκμηριώνουν τη συμβατότητα με το H100 NVL. Δεν απαιτείται HGX baseboard. Σε σύγκριση με άλλες προφορές της MillionMiner. Σε αντίθεση με το H100 SXM 80GB (ξεχωριστή καταχώριση): το SXM προσφέρει υψηλότερο εύρος ζώνης ανά GPU (3.350 GB/s) και συνδεσιμότητα NVSwitch για εκπαίδευση πολλαπλών GPU, αλλά απαιτεί υποδομή HGX baseboard. Σε σύγκριση με το H200 NVL 141GB: το H200 διπλασιάζει τη χωρητικότητα μνήμης με το νεότερο HBM3e για χρήστες που χρειάζονται ακόμη περισσότερο χώρο VRAM. Σε σύγκριση με το RTX PRO 6000 96GB ($10.000 έως $13.000): το RTX PRO 6000 προσφέρει νεότερη αρχιτεκτονική Blackwell με υψηλότερα TFLOPS FP32, αλλά λείπει το εύρος ζώνης HBM, το Transformer Engine και το αποδεδειγμένο οικοσύστημα δεδομένων κέντρου Hopper.

NVIDIA H100 NVL 94GB: Η διαδρομή PCIe προς ενιαία μνήμη για μεγάλο μοντέλο inference

Το H100 NVL υπάρχει για να λύσει ένα συγκεκριμένο πρόβλημα: το πρότυπο H100 SXM έχει 80GB ανά κάρτα, τα οποία δεν είναι αρκετά για να χωρέσουν μοντέλα 70B παραμέτρων σε FP16 (περίπου 140GB) σε μια μεμονωμένη GPU. Το NVL συνδυάζει δύο PCIe H100 κάρτες μέσω τριών NVLink bridges σε μια ενιαία μνήμη 94GB με συνολική ταχύτητα 3,938 GB/s, επιτρέποντας μοντέλα που ξεπερνούν τα 80GB χωρίς την ανάγκη για την υποδομή HGX baseboard που απαιτούν οι κάρτες SXM. Αυτό είναι προϊόν PCIe. Ταιριάζει σε τυπικές μητρικές πλακέτες server με δύο διαδοχικές PCIe Gen 5 x16 θύρες και επαρκή χώρο για NVLink bridges. Δεν απαιτεί HGX baseboard, NVSwitch fabric ή ειδικό πλαίσιο server. Το ζευγάρι NVL συνδέεται με την υπάρχουσα υποδομή server που σχεδιάστηκε αρχικά για A100 PCIe ή παρόμοιες κάρτες, προσφέροντας αναβαθμιστική διαδρομή χωρίς αντικατάσταση server.

Per κάρτα: 14,592 CUDA cores, 456 τέταρτης γενιάς Tensor Cores με FP8 ακρίβεια και Transformer Engine, 47GB HBM3. Per ζευγάρι: 29,184 CUDA cores συνολικά, 94GB HBM3 ενιαία, 3,938 GB/s συνολική μνήμη με bandwidth. TDP 400W ανά κάρτα (800W ανά ζευγάρι, ρυθμιζόμενο 200W έως 600W ανά κάρτα). Αθόρυβος ψύκτης που απαιτεί αερισμό στο πλαίσιο server. Το MIG διαιρεί κάθε κάρτα σε έως και 7 απομονωμένες μονάδες.

Η απόφαση μεταξύ NVL και SXM έρχεται τελικά στην υποδομή. Το SXM προσφέρει μεγαλύτερο bandwidth ανά GPU (3,350 GB/s σε σύγκριση με περίπου 1,979 GB/s ανά κάρτα στο NVL) και συνδέει έως και 8 GPUs μέσω NVSwitch στα 900 GB/s για εργασίες εκπαίδευσης. Το NVL ταιριάζει σε υπάρχουσες πλατφόρμες server PCIe για εργασίες inference, όπου το ενιαίο pool των 94GB έχει μεγαλύτερη σημασία από την ταχύτητα διασύνδεσης πολλαπλών GPUs κατά την εκπαίδευση.

Χρειάζεστε βοήθεια στην επιλογή;

Οι ειδικοί μας στον mining μπορούν να σας βοηθήσουν να βρείτε τον ιδανικό miner για την εγκατάστασή σας και τον προϋπολογισμό σας.

Ζεύγος GPU Tensor Core NVIDIA H100 NVL 94GB PCIe

Δύο κάρτες H100 PCIe συνδεδεμένες μέσω 3x NVLink σε ένα ενιαίο pool μνήμης HBM3 94GB με συνδυασμένη ταχύτητα 3.938 GB/s. 14.592 CUDA cores ανά κάρτα, τέταρτης γενιάς Tensor Cores με FP8 Transformer Engine. TDP 400W ανά κάρτα. PCIe Gen 5 x16. MIG για 7 instances ανά κάρτα. Κατασκευασμένο για LLM inference όπου τα μοντέλα υπερβαίνουν τα 80GB VRAM ανά GPU. Ταιριάζει σε τυπικές πλατφόρμες server PCIe χωρίς HGX baseboard. Παθητικός ψύκτης. Επικοινωνήστε με το MillionMiner για τιμές και διαθεσιμότητα.

94GB Ενοποιημένο μέσω 3x NVLink Bridge

Δύο κάρτες H100 PCIe συνδυάζονται σε μια μνήμη pool 94GB HBM3 στα 3,938 GB/s. Ταιριάζει σε μοντέλα που ξεπερνούν τη χωρητικότητα των 80GB σε single-GPU.

FP8 Transformer Engine για LLM Inference

Οι τέταρτης γενιάς Tensor Cores επιλέγουν αυτόματα FP8/FP16 ανά στρώση. Έως και 30 φορές μεγαλύτερη απόδοση inference σε σύγκριση με το A100 σε μοντέλα transformer.

Μορφή PCIe, δεν απαιτείται HGX

Ταιριάζει σε τυπικές μητρικές πλακέτες διακομιστή με δύο PCIe Gen 5 x16 υποδοχές. Δεν διαθέτει HGX baseboard. Διαδρομή αναβάθμισης από την υπάρχουσα υποδομή A100 PCIe.

Συχνές ερωτήσεις (FAQ)

Συχνές Ερωτήσεις

Δύο κάρτες PCIe H100 συνδεδεμένες μέσω τριών NVLink bridges δημιουργώντας ένα ενιαίο pool μνήμης HBM3 χωρητικότητας 94GB. Το ζεύγος εμφανίζεται ως ένας ενιαίος προσιτός χώρος μνήμης στο λογισμικό. 47GB ανά κάρτα, 94GB συνολικά. Επιβεβαιώστε με τη MillionMiner εάν η τιμή πώλησης καλύπτει το ζεύγος ή μόνο μια κάρτα.

NVL: PCIe μορφότυπος, 94GB ενιαίος ανά ζεύγος, ταιριάζει σε τυπικές μητρικές πλακέτες server, βελτιστοποιημένο για LLM inference. SXM: μορφότυπος mezzanine, 80GB ανά κάρτα, απαιτεί βάση HGX, το NVSwitch συνδέει έως και 8 GPUs με 900 GB/s, βελτιστοποιημένο για πολυ-GPU εκπαίδευση. Το NVL είναι η πιο απλή διαδρομή υποδομής. Το SXM είναι η διαδρομή υψηλότερης απόδοσης για εκπαίδευση.

Μοντέλα 70B παραμέτρων σε FP16 (περίπου 140GB με χώρο αποθήκευσης KV cache στο ζεύγος). Μοντέλα 30B έως 40B σε FP16 με μεγάλες ομαδοποιήσεις. Το Llama 3 70B, το DeepSeek 67B και παρόμοια μοντέλα ανοικτού βάρους προχωρημένου επιπέδου τρέχουν στο ζεύγος NVL χωρίς ποσοτικοποίηση.

Αυτόματη διαχείριση μικτής ακρίβειας σε επίπεδο υλικού, μοναδική για τις αρχιτεκτονικές Hopper και νεότερα NVIDIA. Επιλέγει δυναμικά την ακρίβεια FP8 ή FP16 ανά στρώση νευρωνικού δικτύου κατά τη διάρκεια της inference και της εκπαίδευσης, μεγιστοποιώντας το throughput χωρίς χειροκίνητη ρύθμιση ακρίβειας. Παρέχει έως 4x επιτάχυνση στην εκπαίδευση και 30x throughput στην inference σε σύγκριση με το A100 σε transformer μοντέλα.

Οποιοσδήποτε διακομιστής με δύο διαδοχικές υποδοχές PCIe Gen 5 x16 και φυσική διακοπή για τρείς γέφυρες NVLink που εκτείνονται και τις δύο κάρτες. Η Supermicro, Dell PowerEdge, HPE ProLiant, Lenovo ThinkSystem όλα καταγράφουν τη συμβατότητα. Υποστηρίζονται πλατφόρμες CPU AMD EPYC και Intel Xeon Scalable.

Ναι. Έως 7 πλήρως απομονωμένες περιπτώσεις ανά κάρτα (14 συνολικά ανά ζεύγος) με ξεχωριστή μνήμη, cache και υπολογιστική ισχύ. Κάθε περίπτωση λειτουργεί ανεξάρτητα με εγγυημένη QoS.

Ζεύγος H100 NVL: αρχιτεκτονική Hopper, 94GB HBM3 ενιαίο, 3.938 GB/s συνολική εύρος ζώνης, FP8 Transformer Engine, 800W ανά ζεύγος. A100 80GB: Ampere, 80GB HBM2e, 1.935 GB/s, χωρίς FP8, 300W. Το H100 NVL προσφέρει περίπου 2x έως 3x περισσότερα tokens inference ανά δευτερόλεπτο για μοντέλα transformer. Το A100 κοστίζει σημαντικά λιγότερο ανά κάρτα.

Βάση αρχιτεκτονικής Same Hopper. Το H200 NVL αναβαθμίζεται σε 141GB HBM3e (σε αντίθεση με 94GB HBM3) με υψηλότερο εύρος ζώνης. Για μοντέλα που υπερβαίνουν τα 94GB, το H200 NVL είναι η επόμενη επιλογή. Για μοντέλα που ταιριάζουν εντός των 94GB, το H100 NVL προσφέρει ισχυρή σχέση τιμής προς απόδοση.

Ζεύγος H100 NVL: 94GB HBM3, εύρος ζώνης 3.938 GB/s, Transformer Engine FP8, 7 instances MIG ανά κάρτα, αποδεδειγμένο οικοσύστημα data center. RTX PRO 6000: 96GB GDDR7, 1.792 GB/s, χωρίς Transformer Engine, νεότερη αρχιτεκτονική Blackwell, 125 TFLOPS FP32. Το H100 NVL κερδίζει στην εύρος ζώνης HBM (2.2x) και στην απόδοση inference του Transformer Engine. Το RTX PRO 6000 κερδίζει στη υπολογιστική ισχύ FP32 και στο κόστος ανά κάρτα.