Δεν βρέθηκαν προϊόντα για ""
Gigabyte
Μοντέλο: G893-ZD1-AAX5
Η πλατφόρμα 8U της Gigabyte για το βασικόboard NVIDIA HGX B200: οκτώ Blackwell B200 SXM GPUs με 180GB HBM3e η κάθε μια, 1.4TB και 64 TB/s μνήμη ανά κόμβο, ενωμένα με NVLink πέμπτης γενιάς στα 1.8 TB/s ανά GPU μέσω NVSwitch. Διπλοί επεξεργαστές AMD EPYC 9005 ή 9004 σειράς, είκοσι τέσσερα modules DDR5, οκτώ θύρες Gen5 NVMe και δώδεκα τροφοδοτικά Titanium 3000W σε ρύθμιση redundancy 6+6, τα οποία το κρατούν σε αερόψυξη. Η τρέχουσα Blackwell frontier για AI σε single-node, προσφερόμενη και αποστολή σε όλο τον κόσμο DDP από την MillionMiner.
Ζητήστε την προσφορά για τον διακομιστή σας
Πείτε μας τις ανάγκες φορτίου εργασίας και υλοποίησης. Ο ειδικός μας απαντά εντός 24 ωρών μέσω email, WhatsApp ή τηλεφώνου.
Γιατί αυτός ο διακομιστής αναφέρεται για παραγγελία
Αυτοί οι διακομιστές έχουν διαμορφωθεί και προσφερόμενοι κατόπιν παραγγελίας.Η διαμόρφωσή σας, ο αποθηκευτικός χώρος, το δίκτυο, η εγγύηση και η ενσωμάτωση σε rack καθορίζουν την τελική τιμή, ενώ ο προορισμός παράδοσης σας καθορίζει τα έξοδα αποστολής και τελωνείου.Υποβάλετε την παρακάτω φόρμα και ο ειδικός μας θα απαντήσει εντός 24 ωρών με πλήρη προσφορά που περιλαμβάνει υλικό, εγγύηση και παγκόσμια παράδοση DDP.
Ευχαριστούμε! Ο ειδικός μας θα απαντήσει εντός 24 ωρών με την προσαρμοσμένη προσφορά σας.
Πώς λειτουργεί η παραγγελία του διακομιστή σας
Υποβάλετε τη φόρμα
Μοιραστείτε λεπτομέρειες φόρτου εργασίας & ανάπτυξης
Λάβετε την προσφορά σας
Ολοκληρωμένη τιμολόγηση εντός 24 ωρών
Ανασκόπηση με ειδικό
Ολοκλήρωση ρύθμισης και παράδοσης
Παράδοση
Αποσταλεί και έτοιμο για ανάπτυξη
Αυθεντικό
Δοκιμασμένο υλικό
Παγκοσμίως
Παγκόσμια αποστολή
Υποστήριξη
Ειδικοί στην εξόρυξη
Τιμές, χρόνος παράδοσης και επιλογές hosting. Προσωπικές συμβουλές από την ομάδα πωλήσεών μας.
Τιμές, χρόνος παράδοσης και επιλογές hosting. Προσωπικές συμβουλές από την ομάδα πωλήσεών μας.
Κάθε γενιά GPU πωλείται ως επανάσταση. Ο ακριβής τρόπος να αξιολογήσετε το Blackwell είναι να διαχωρίσετε τις φυσικές αλλαγές από τα πολλαπλασιαστικά των marketing, και αυτός ο διακομιστής ανταμείβει αυτήν την άσκηση, επειδή οι φυσικές αλλαγές είναι σημαντικές.
Ο ίδιος ο GPU. Κάθε NVIDIA B200 είναι μια πακέτο διπλού die: δύο die, το καθένα στο όριο της κατασκευής, ενωμένα μέσω μιας διεπαφής die-to-die 10 TB/s και παρουσιάζονται στο λογισμικό ως ένας ενιαίος GPU με 208 δισεκατομμύρια τρανζίστορ. Κάθε ένα φέρει 180GB από HBM3e με περίπου 8 TB/s εύρος ζώνης, σε σύγκριση με 141GB στα 4.8 TB/s στο H200. Η δεύτερη γενιά Transformer Engine επεκτείνει την ακολουθία ακρίβειας μέχρι FP4 με μικρο-θεμέλια κλιμάκωσης, hardware που παρακολουθεί την κλίμακα ποσοτικοποίησης σε λεπτομερή κλίμακα έτσι ώστε η inference με τέσσερα bits να διατηρεί την ακρίβεια που χάθηκε στην παλαιότερη απλοϊκή ποσοτικοποίηση. Η πέμπτη γενιά NVLink διπλασιάζει το fabric στα 1.8 TB/s ανά GPU.
Οι μαθηματικές υπολογισμοί του κόμβου. Οκτώ GPUs B200 SXM σε βάση HGX αντλούν 1,440GB από HBM3e, 64 TB/s συνολική εύρος ζώνης μνήμης και 144 petaFLOPS από FP4 υπολογισμούς, με NVSwitch να ενώνει κάθε GPU με κάθε άλλο στο πλήρες NVLink ρυθμό, 14.4 TB/s συνολικό fabric. Σε όρους φόρτου εργασίας: μοντέλα με λίγες εκατοντάδες δισεκατομμύρια παραμέτρους προσαρμόζονται με ακρίβεια στο εσωτερικό ενός κόμβου, μοντέλα με τρισεκατομμύρια παραμέτρους λειτουργούν σε πραγματικό χρόνο σε έναν κόμβο με FP4, inferencing με μεγάλα context και KV cache, και αρχιτεκτονικές Mixture-of-Experts δρομολογούν μεταξύ ειδικών σε fabric ταχύτερα από την γενιά H200. Οι δημοσιευμένες συγκρίσεις της NVIDIA, μέχρι 15x πραγματικό χρόνο inference τρισεκατομμυρίων παραμέτρων και περίπου 3x εκπαίδευση σε σύγκριση με την γενιά H100, είναι στοιχεία του κατασκευαστή, αλλά οι διαφορές στο hardware πίσω από αυτές δεν είναι.
Η πλατφόρμα Gigabyte. Ο host είναι διπλός AMD EPYC 9005 ή 9004 σειράς, με έως 192 πυρήνες ανά socket στη σειρά 9005, που έχει σημασία για την tokenization, augmentation και data-loading εργασία που τροφοδοτεί οκτώ GPUs αυτής της κλάσης. Ραφινά modules DDR5 γεμίζουν μια ανά κανάλι σε δώδεκα κανάλια ανά επεξεργαστή, η διαμόρφωση που διατηρεί ολόκληρο το εύρος ζώνης μνήμης αντί να το ανταλλάσσει με容量. Η αποθήκευση διαθέτει οκτώ hot-swap Gen5 NVMe bays για τοπικά datasets. Η διάταξη PCIe είναι κατασκευασμένη για clustering: οκτώ θέση με ένα slot λαμβάνει έναν adapter 400 Gb/s ανά GPU, η τοπολογία one-to-one που θέλει το GPUDirect RDMA, σε NVIDIA Quantum-2 InfiniBand ή Spectrum-X Ethernet, με τέσσερις επιπλέον διπλούς θέσεις για αποθήκευση και management networking. Η ισχύς αποτελείται από δώδεκα τροφοδοτικά 3000W 80 PLUS Titanium σε διαμόρφωση 6+6 με redundance, και ο θερμικός σχεδιασμός κινεί ολόκληρο το GPU complex με αέρα, που διατηρεί την ανάπτυξη μέσα σε συνηθισμένα data centers και όχι στα λίγα κατάλληλα για υγρό.
Η απόφαση κατά των συστημάτων H200 σε αυτό το καταλόγο. Τα πλατφόρμα Lenovo και ASUS HGX H200 αποδίδουν 1.1TB ανά κόμβο σε fabric 900 GB/s, και για ομάδες που προσαρμόζουν μοντέλα 70B ή λειτουργούν εντός αυτού του εύρους μνήμης, παραμένουν η λογική αγορά. Ο κόμβος B200 κερδίζει το premium του σε τρεις περιπτώσεις: στόλοι inference που εξυπηρετούν μοντέλα frontier-scale όπου το FP4 διπλασιάζει τα tokens ανά watt, εκπαιδευτικές λειτουργίες όπου το διπλό fabric και το 60 τοις εκατό κέρδος στην εύρος ζώνης μειώνουν τους χρόνους που έχουν επιχειρηματική αξία, και φόρτους εργασίας που ήδη πιέζουν το όριο μνήμης του H200. Κάτω από αυτές τις εκροές, τα οικονομικά Hopper κερδίζουν· σε αυτές, το Blackwell νικά.
Η απόφαση κατά του rack-scale Blackwell. Πάνω από αυτό το μηχάνημα βρίσκεται η κατηγορία NVIDIA DGX GB200, όπου 72 GPUs μοιράζονται ένα NVLink domain σε rack scale. Το όριο είναι το ίδιο το NVLink domain: αν η παράλληλη εκπαίδευση σου χρειάζεται περισσότερα από οκτώ GPUs σε ένα ενιαίο συνεκτικό fabric, η λύση rack-scale είναι η απάντηση, και αυτό φέρνει υγρή ψύξη, μηχανική εγκατάστασης και μια διαφορετική τάξη δέσμευσης. Για όλα όσα χωρούν οκτώ Blackwell GPUs, που περιλαμβάνουν την πλειονότητα της επιχειρηματικής εκπαίδευσης και σχεδόν όλη την inference, αυτό το κόμβος παρέχει την ίδια γενιά χωρίς το έργο εγκατάστασης.
Εξαγωγική συμμόρφωση και παραγγελίες. Οι Blackwell-class accelerators υπόκεινται σε αμερικανικούς ελέγχους εξαγωγής, και η MillionMiner επιβεβαιώνει την επιλεξιμότητα προορισμού ως μέρος κάθε προσφοράς. Κάθε σύστημα διαμορφώνεται για παραγγελία, δοκιμάζεται και αποστέλλεται παγκοσμίως DDP με τις δασμολογικές και τελωνειακές διαδικασίες αναλαμβανόμενες. Ο προγραμματισμός ανάπτυξης και η φιλοξενία στους δικούς της data centers της MillionMiner είναι διαθέσιμα για ομάδες που προτιμούν να μην διαμορφώσουν ρεύμα σε rack σε αυτό το μέγεθος onsite.
Το generational marketing είναι θορυβώδες, οπότε εδώ είναι το βήμα Blackwell που δηλώνεται με αριθμούς. Για κάθε GPU, η μνήμη αυξάνεται από τα 141 GB του H200 στα 180 GB της HBM3e, και η εύρους ζώνης από 4,8 σε περίπου 8 TB/s, μία αύξηση 60 τοις εκατό. Το fabric NVLink διπλασιάζεται, 1,8 TB/s ανά GPU σε σχέση με 900 GB/s, μέσω NVSwitch σε πλήρες mesh. Για κάθε κόμβο, αυτό συμπληρώνεται σε 1,4TB κοινόχρηστη GPU μνήμη, 64 TB/s συνολικό εύρος ζώνης και 144 petaFLOPS υπολογιστικής ισχύος FP4. Καθένα από τα B200 είναι ίδιος σχεδιασμός διπλού die, δύο dies περιορισμένου reticle που συνδέονται στα 10 TB/s και παρουσιάζονται ως μία GPU με 208 δισεκατομμύρια τρανζίστορ.
Η ιστορία της ακρίβειας έχει τόση σημασία όση και το εύρος ζώνης. Το δεύτερης γενιάς Transformer Engine του Blackwell εισάγει το FP4 με μικρο-τοξωτές κλιμακώσεις, που είναι αυτό που μετατρέπει τα μοντέλα με τρισεκατομμύρια παραμέτρους από προβλήματα cluster σε προβλήματα κόμβου για inference. Τα δημοσιευμένα στοιχεία της NVIDIA δείχνουν ότι η HGX B200 πραγματικός χρόνος inference φτάνει μέχρι 15 φορές την γενιά H100 σε εργασίες με τρισεκατομμύρια παραμέτρους, με την ενέργεια ανά token να μειώνεται αναλόγως. Για την εκπαίδευση, η NVIDIA αναφέρει περίπου 3 φορές την γενιά H100. Αυτά είναι Benchmark των κατασκευαστών και πρέπει να διαβάζονται ως τέτοια, αλλά οι αρχιτεκτονικές αλλαγές που τα υποστηρίζουν, FP4, διπλό fabric, 60 τοις εκατό περισσότερη bandwidth μνήμης, είναι φυσικά γεγονότα.
Η πλατφόρμα host της Gigabyte ανταποκρίνεται. Διπλοί επεξεργαστές AMD EPYC 9005 ή 9004 σειράς φτάνουν τους 192 πυρήνες ανά socket για pipelines με βαριά προ-επεξεργασία, με εικοσιτέσσερα DDR5 modules που γεμίζουν το ένα module ανά κανάλι σε δώδεκα κανάλια ανά επεξεργαστή, η διάταξη που διατηρεί όλο το εύρος ζώνης μνήμης. Οκτώ θύρες NVMe Gen5 κρατούν τα datasets τοπικά, οκτώ θέσεις PCIe με μία κάρτα κάθε, για Quantum-2 InfiniBand ή Spectrum-X clustering, και δώδεκα τροφοδοτικά Titanium 3000W σε διάταξη 6+6 με redundant, κουβαλούν την πρόκληση, με αεροψύξη. Αναφέρεται για διαμόρφωση και αποστολή παγκοσμίως DDP από την MillionMiner.
Οι ειδικοί μας στον mining μπορούν να σας βοηθήσουν να βρείτε τον ιδανικό miner για την εγκατάστασή σας και τον προϋπολογισμό σας.
Αυτό είναι το επίπεδο Blackwell: οκτώ NVIDIA B200 SXM GPUs στην πλακέτα HGX, καθεμία με 180GB HBM3e, συνδυάζοντας 1.4TB GPU μνήμη και 64 TB/s εύρος ζώνης σε έναν κόμβο. Το πέμπτης γενιάς NVLink ενώνεται με κάθε GPU στα 1.8 TB/s μέσω NVSwitch, διπλασιάζοντας το fabric H200, και η δεύτερης γενιάς Transformer Engine προσθέτει ακρίβεια FP4, την οποία η NVIDIA αναφέρει ότι επιτυγχάνει έως και 15x πραγματικό χρόνο inference για μοντέλα τρισεκατομμυρίων παραμέτρων σε σύγκριση με την γενιά H100. Ο Gigabyte το φιλοξενεί σε διπλούς επεξεργαστές AMD EPYC 9005 ή 9004 με είκοσι τέσσερα modules DDR5, οκτώ Gen5 NVMe bays, και δώδεκα τροφοδοτικά Titanium 3000W, ψυγμένα με αέρα. Αναφερόμενο και αποστέλλεται παγκοσμίως DDP από την MillionMiner.
Οκτώ GPU B200 SXM στα 180GB η κάθε ένα σε NVSwitch. Η inference κατηγορίας δισεκατομμυρίων παραμέτρων γίνεται μια ενιαία αγορά κόμβου με αερόψυξη.
Διαθέσιμος δεύτερης γενιάς Transformer Engine με μικρο-τάνσον scaling. Η NVIDIA αναφέρει έως και 15x πραγματικό χρόνο inference σε σύγκριση με τη γενιά H100.
Πέμπτης γενιάς NVLink στα 1.8 TB/s ανά GPU, 14.4 TB/s σε ολόκληρο το κόμβο. Συγχρονισμός gradient και MoE routing σε διπλάσιο εύρος Hopper.
NVIDIA
Επικοινωνήστε για τιμή
Supermicro
Επικοινωνήστε για τιμή
ASUS
Επικοινωνήστε για τιμή
ASUS
Επικοινωνήστε για τιμή
HGX B200 είναι το οικοδομικό τετράγωνο 8-GPU της NVIDIA Blackwell: οκτώ B200 SXM GPUs και το υφαντό NVSwitch που τα ενώνει, προμηθεύονται σε κατασκευαστές όπως η Gigabyte που σχεδιάζουν πλήρη servers γύρω από αυτό. Οι φυσικές αλλαγές σε σχέση με το Hopper: κάθε B200 είναι ένα πακέτο διπλού die με 208 δισεκατομμύρια τρανζίστορ, η μνήμη αυξάνεται σε 180GB HBM3e ανά GPU με περίπου 8 TB/s, το NVLink διπλασιάζεται σε 1.8 TB/s ανά GPU, και η δευτερογενής γενιά Transformer Engine προσθέτει FP4 ακρίβεια με μικρο-τόνιο κλιμάκωσης.
<α1>1,440GB of pooled HBM3e, 64 TB/s of aggregate memory bandwidth, 144 petaFLOPS of FP4 compute, and 14.4 TB/s of NVLink fabric through NVSwitch. Σε όρους φόρτου εργασίας: πλήρους ακρίβειας fine-tuning μοντέλων σε χαμηλές εκατοντάδες δισεκατομμύρια παραμέτρους, πραγματικό χρόνο FP4 εξυπηρέτηση μοντέλων τρισεκατομμυρίων παραμέτρων, και inference με μεγάλο context με KV cache περιθώριο πέρα από κάθε κόμβο Hopper.
Τρεις καταστάσεις. Συρτάκια inference σε θερμοκοιτίδα κλίμακας, όπου το FP4 διπλασιάζει περίπου τα tokens ανά watt και η NVIDIA αναφέρει έως και 15x πραγματικό χρόνο inference τρισεκατομμυρίων παραμέτρων σε σύγκριση με την γενιά H100. Προγράμματα εκπαίδευσης όπου το διπλασιασμένο fabric και το 60 τοις εκατό gain bandwidth συμπιέζουν τα χρονοδιαγράμματα με επιχειρηματική αξία. Και φόρτοι εργασίας που ήδη πιέζουν το όριο των 141GB ανά-GPU του H200. Ομάδες που βελτιστοποιούν μοντέλα της τάξης των 70B ή εξυπηρετούν εντός του πλαισίου Hopper τυπικά εξυπηρετούνται καλύτερα από τα συστήματα Lenovo ή ASUS HGX H200, και η MillionMiner θα μοντελοποιήσει και τα δύο στην προσφορά.
Χρήσιμο, με μηχανική. Η δεύτερη γενιά του Transformer Engine υλοποιεί μικρο-τενσόρ κλιμάκωση, παρακολουθώντας την κλίμακα ποσοτικοποίησης με λεπτομερή λεπτότητα ώστε τα τετράμπιτ βάρη να διατηρούν την ακρίβεια που χάνει η απλή ποσοτικοποίηση. Οι στοίβες παραγωγής που περιλαμβάνουν το TensorRT-LLM το υποστηρίζουν, και η inference μεγάλων μοντέλων είναι ο τομέας όπου αποδίδει: το αποτύπωμα μνήμης μειώνεται κατά το ήμισυ σε σχέση με το FP8 και η απόδοση roughly διπλασιάζεται. Η εκπαίδευση εξακολουθεί να τρέχει με FP8 και BF16· το FP4 αποτελεί μοχλό οικονομίας στην inference, και έναν μεγάλο σε fleet scale.
Ναι, αυτή είναι η μηχανική βάση αυτής της πλατφόρμας Gigabyte: ένα πλαίσιο 8U με όγκο ροής αέρα ικανό να αντέξει ολόκληρο το HGX B200 complex σύμφωνα με τις προδιαγραφές, χωρίς άμεση υγρή ψύξη. Η πρακτική συνέπεια είναι η ελευθερία εγκατάστασης, καθώς δεν χρειάζεται διανομή ψυκτικού, υδραυλικές εγκαταστάσεις ή συντήρηση υγρού κύκλου και οποιοδήποτε κέντρο δεδομένων με επαρκή ισχύ και συμβατική ψύξη είναι κατάλληλο. Η MillionMiner επιβεβαιώνει τις απαιτήσεις ροής αέρα και εισαγωγής θερμοκρασίας για τον χώρο σας κατά την προσφορά.
Βαθμός πυκνότητας πυρήνων και εύρος ζώνης μνήμης. Η σειρά EPYC 9005 φτάνει τους 192 πυρήνες ανά socket, τροφοδοτώντας pipelines με φορτίο προεπεξεργασίας για οκτώ GPUs αυτής της κλάσης, και η πλατφόρμα τρέχει δωδέκατα κανάλια DDR5 ανά επεξεργαστή με τα είκοσι τέσσερα modules κατανεμημένα ένα ανά κανάλι, η διαρρύθμιση που διατηρεί πλήρες εύρος ζώνης. Ο προϋπολογισμός PCIe Gen5 lane επίσης μεταφέρει την τοπολογία δικτύωσης ενός adapter ανά GPU χωρίς συμβιβασμούς. Η σειρά 9004 συνεχίζει να είναι διαθέσιμη για ομάδες που έχουν τυποποιήσει αυτήν.
Το όριο είναι ο τομέας NVLink. Αυτός ο κόμβος ενώνει οκτώ GPU σε μια συνεκτική διαδιδόμενη δομή· η κλάση GB200 ενώνει 72 σε επίπεδο rack, με υγρή ψύξη και μηχανική εγκαταστάσεων που ταιριάζουν. Εάν ο παράλληλος εκπαιδευτής σας πραγματικά χρειάζεται περισσότερα από οκτώ GPU σε έναν ενιαίο τομέα, η λύση είναι το επίπεδο rack. Για όλα όσα χωρούν οκτώ Blackwell GPU, που καλύπτει το μεγαλύτερο μέρος της επιχειρηματικής εκπαίδευσης και σχεδόν όλη την εξυπηρέτηση inference, αυτός ο κόμβος παρέχει την ίδια γενιά χωρίς το έργο εγκαταστάσεων, και επεκτείνεται έξω μέσω InfiniBand.
Μέσω της διαμόρφωσης one-adapter-per-GPU, η διάταξη PCIe κατασκευάζεται για: οκτώ θέσεις single-slot φιλοξενούν adapters 400 Gb/s σε NVIDIA Quantum-2 InfiniBand ή Spectrum-X Ethernet, παρέχοντας στο GPUDirect RDMA μία dedicated fabric port ανά GPU, έτσι ώστε τα gradients να μετακινούνται μεταξύ των κόμβων χωρίς να αγγίζουν τον επεξεργαστή. Τέσσερις πρόσθετες dual-slot θέσεις φέρουν αποθήκευση και διαχείριση δικτύωσης. Η MillionMiner συμβουλεύει σχετικά με το σχεδιασμό switch και fabric όταν μια εγκατάσταση μεγαλώνει πέρα από ένα μηχάνημα.
Δωδεκάδες τροφοδοτικά 3000W 80 PLUS Titanium σε διαμόρφωση 6+6 με redundancy καθορίζουν το πλαίσιο, με το σύστημα GPU να είναι ικανό να καταναλώσει οκτώ κιλοβάτ υπό σταθερό φορτίο πριν ληφθεί υπόψη ο host. Αυτό είναι καθαρά μια μηχανή data center. Η MillionMiner επιβεβαιώνει την ακριβή κατανάλωση της διαμόρφωσής σας κατά τη διάρκεια της προσφοράς, και η φιλοξενία στις δικές της εγκαταστάσεις της MillionMiner είναι διαθέσιμη για ομάδες που προτιμούν να μην προμηθεύονται ρεύμα rack σε αυτήν την κλίμακα.
Υποβάλετε τις λεπτομέρειες φόρτου εργασίας, κλίμακας και ανάπτυξης μέσω της φόρμας προσφοράς. Ένας ειδικός της MillionMiner επιβεβαιώνει τη διαμόρφωση, την επιλεξιμότητα προορισμού σύμφωνα με τον έλεγχο εξαγωγών των ΗΠΑ που ισχύει για τους Blackwell-class accelerators και το σχέδιο παράδοσης. Κάθε σύστημα υπόκειται σε δοκιμή πριν από την αποστολή και παραδίδεται παγκοσμίως DDP με τις δασμολογικές και τελωνειακές διαδικασίες να χειρίζονται. Οδηγίες ενσωμάτωσης rack και φιλοξενούμενη ανάπτυξη είναι διαθέσιμες και οι δύο.