re-Built GPU Servers and AI Workstations

Τελειοποιημένοι διακομιστές GPU και AI workstations διαμορφωμένοι σύμφωνα με τις προδιαγραφές σας, συναρμολογημένοι, δοκιμασμένοι, δοκιμασμένοι και αποστραγγισμένοι, έτοιμοι προς ανάπτυξη. Ενιαίες επιτραπέζιες workstations με RTX 5090 32GB σε πλατφόρμες AMD Ryzen 9 ή Intel Core για τοπική AI inference και ανάπτυξη. Workstations με διπλό GPU σε AMD Threadripper PRO με 128 PCIe 5.0 lanes για πλήρη εύρος ζώνης και στους δύο GPUs, 64GB έως 192GB συνολικό VRAM ανάλογα με την επιλογή κάρτας. Servers inference με quad-GPU με blower cards για παράλληλη εξυπηρέτηση μοντέλων, ενοικίαση GPU farming στο Clore.ai και Vast.ai, ή λειτουργίες mining. Οκτα-GPU servers με RTX 5090 Blower που αποδίδουν περίπου 838 TFLOPS FP32 συνολικά από έναν κόμβο. Η MillionMiner αναλαμβάνει τη συμβατότητα των components, τη μηχανική παροχής ισχύος, την κατανομή των PCIe lane και τις δοκιμές σταθερότητας που απαιτούν οι κατασκευές με πολλά GPU. Τα συστήματα αναπτύσσονται στην hosting της MillionMiner με κόστος $0.07 έως $0.08 ανά kWh με απομακρυσμένη διαχείριση μέσω του EPS dashboard, ή αποστέλλονται στη τοποθεσία σας. Επικοινωνήστε με τις πωλήσεις μέσω Get a Quote με τον αριθμό GPU, τον τύπο εργασίας και την προτίμηση ανάπτυξης.

5.0
αστέρας αστέρας αστέρας αστέρας αστέρας
4.97
αστέρας αστέρας αστέρας αστέρας αστέρας
4.5
αστέρας αστέρας αστέρας αστέρας αστέρας
honecomb-grid honecomb-grid
Φιλτράρισμα & Ταξινόμηση

Συστήματα Βαρέως Βιομηχανίας

Διαμορφωμένο, δοκιμασμένο & επιβεβαιωμένο με burn-in

Εφοδιαστική logistics

Εγγυημένο παλέτα και αεροπορική μεταφορά σε όλο τον κόσμο

Αποδεκτά Crypto

Πληρωμή με BTC, ETH, USDT & περισσότερα

Εξειδικευμένη Υποστήριξη

Έμπειροι αρχιτέκτονες υποδομής AI διαθέσιμοι

Συστήματα Server AI

Υπερυπολογιστές AI με πολλαπλές GPU: Από σταθμούς εργασίας με 2-GPU έως κόμβους HGX με 8-GPU

Ένας διακομιστής AI δεν είναι απλώς ένας υπολογιστής με πρόσθετο GPU. Η σοβαρή υποδομή AI απαιτεί πλατφόρμες ειδικά κατασκευασμένες: fabric NVSwitch υψηλής εύρους ζώνης για επικοινωνία GPU-to-GPU, μνήμη DDR5 υψηλής χωρητικότητας, επεξεργαστές επιπέδου enterprise με αρκετές γραμμές PCIe για την τροφοδοσία κάθε GPU, αποθηκευτικό χώρο NVMe για γρήγορο checkpoint I/O, και συστήματα τροφοδοσίας αξιολογημένα για 10+ kW ανά μονάδα rack. Παρέχουμε ολοκληρωμένες πλατφόρμες διακομιστών AI — από συστήματα τύπου tower με 2-GPU για ερευνητικά εργαστήρια έως τους κόμβους NVIDIA HGX H100/H200 με 8-GPU και τη νέα αρχιτεκτονική GB200 NVL72 rack-scale — έτοιμες για άμεση υλοποίηση.

Αριθμός GPU DGX H100

8 × H100 SXM5

640 GB συνολικά HBM2e μέσω NVSwitch

Αριθμός GPU NVL72

72 GPUs

GB200 σε ένα μόνο ράφι — 1 λογική μονάδα

DGX H100 AI Απόδοση.

32 PFLOPS

FP8 sparse — διασταυρωμένο 8 × H100

HGX H200 Μνήμη

1.1 TB HBM3e

8 × H200 SXM5 — 38.4 TB/s συνολική Ταχύτητα Μεταφοράς Δεδομένων


Σύγκριση Πλατφόρμας Server AI

Βασικές Πλατφόρμες που Προμηθεύουμε

NVIDIA DGX H100

8 × H100 SXM5, 640 GB

Ολοκληρωμένος υπερυπολογιστής AI σε κουτί. NVSwitch full-mesh στα 900 GB/s ανά GPU. Dual Xeon ή AMD Epyc, 2 TB DDR5. Πλατφόρμα αναφοράς για εταιρικό AI.

NVIDIA DGX H200

8 × H200 SXM5, 1.1 TB

Διάδοχος του DGX H100. 4,8 TB/s HBM3e ανά GPU. Προτιμάται για την inference μεγάλων μοντέλων σε μεγάλη κλίμακα όπου η χωρητικότητα μνήμης είναι κρίσιμη.

NVIDIA HGX H100/H200

OEM platform (8-GPU)

Το συγκρότημα GPU board + NVSwitch αποστάλθηκε στους OEM εταίρους (Supermicro, Dell, HPE, Lenovo). Επιτρέπει το ίδιο δίκτυο GPU σε προσαρμοσμένους διαμορφώσεις διακομιστών.

NVIDIA GB200 NVL72

72 × GB200 GPUs

Ένα σύστημα με μία μόνο ράγα. 36 Grace CPU + 72 Blackwell GPU modules. 1.44 ExaFLOPS FP4. NVLink 5 fabric — ολόκληρη η ράγα λειτουργεί ως μία GPU.

4-GPU Tower / Rack (RTX PRO 6000)

Up to 4 × 96 GB

Εξυπηρετητής επιπέδου Workstation για ερευνητικά εργαστήρια και νεοφυείς επιχειρήσεις AI. Διπλό socket Xeon W9 ή Threadripper Pro, 4 × RTX PRO 6000 BW μέσω ζευγών NVLink Bridge.

2-GPU Inference Server (A100 / H100 PCIe)

2 × 80 GB HBM2e

Κόστος-αποτελεσματικοί κόμβοι inference. Τυπικό κάθισμα 2U, διπλές θέσεις PCIe 5.0. Ταιριάζει σε τυπική colocations rack χωρίς να απαιτείται υγρή ψύξη.

1U Edge Inference (L4 / A2)

4–8 × 24 GB PCIe

Υψηλής πυκνότητας, χαμηλής κατανάλωσης ενέργειας inference. Μονόrapς L4 GPUs στα 72 W η κάθε μια. Έως 8 GPUs σε 1U με συνολική κατανάλωση κάτω από 600 W — ιδανικό για co-lo edge PoPs.

Η Αρχιτεκτονική Πίσω από τους AI Servers

Γιατί οι Servers AI διαφέρουν ουσιωδώς από τους τυπικούς Servers

Η θεμελιώδης διαφορά μεταξύ ενός server γενικής χρήσης και ενός AI server είναι το fabric των GPU. Σε έναν τυπικό server, οι GPUs επικοινωνούν μέσω PCIe — μια αρχιτεκτονική bus με ρυθμό περίπου 32–64 GB/s αμφίδρομα ανά slot. Σε έναν AI server βασισμένο σε NVSwitch, κάθε GPU στο σύστημα συνδέεται ταυτόχρονα με κάθε άλλο GPU μέσω του ASIC NVSwitch στα 900 GB/s ανά GPU (H100) ή 1.8 TB/s ανά GPU (H200 / Blackwell). Αυτό δεν αποτελεί βελτίωση εμπόδιο — είναι μια ποιοτική αλλαγή που επιτρέπει το μοντέλο παράλληλης επεξεργασίας σε GPUs, σαν να ήταν μια μεγαλύτερη συσκευή.

Το υποσύστημα CPU και μνήμης πρέπει να ταιριάζει με τις απαιτήσεις εύρους ζώνης της GPU. Το DGX H100 συνδυάζει το υφαντό NVSwitch 8-GPU με διπκούς Intel Xeon Platinum CPUs και 2 TB DDR5 ECC RAM — αρκετή μνήμη συστήματος για την προετοιμασία δεδομένων εκπαίδευσης, την εκτέλεση pipelines προεπεξεργασίας και τη διαχείριση I/O checkpoint χωρίς να αποτελούν το εμπόδιο. Οι γραμμές PCIe 5.0 διανέμονται προσεκτικά έτσι ώστε κάθε GPU να έχει άμεση σύνδεση x16 με το υφαντό CPU.

Η παροχή ενέργειας αποτελεί από μόνη της μια μηχανική πρόκληση. Ένα πλήρως φορτωμένο DGX H100 καταναλώνει περίπου 10,2 kW — απαιτώντας 2 × 30A, 240V κυκλώματα στη Βόρεια Αμερική ή τριφασικό 32A στην Ευρώπη. Ο ψυκτικός σχεδιασμός είναι εξίσου απαιτητικός: το αναφοράς σχέδιο της NVIDIA χρησιμοποιεί έναν ανταλλάκτη θερμότητας στην πίσω πόρτα ή άμεση ψύξη με υγρό για το module GPU στις διαμορφώσεις DGX. Ο σχεδιασμός της παροχής ενέργειας και της ψύξης της εγκατάστασής σας πριν την παραγγελία δεν είναι επιλογή — είναι το πρώτο βήμα.


AI σε Μονάδα Κλίμακας Ραφιών

NVIDIA GB200 NVL72: 72 GPUs ως Ένας Λειτουργικός Επιταχυντής

Το GB200 NVL72 είναι η πιο φιλόδοξη αρχιτεκτονική συστήματος της NVIDIA έως σήμερα. Ένα μόνο ράφι φιλοξενεί 36 μονάδες CPU Grace και 72 Blackwell GB200 GPU dies, όλα συνδεδεμένα μέσω μιας τετάρτης γενιάς NVLink fabric στα 1.8 TB/s ανά GPU — επιτρέποντας σε ολόκληρο το ράφι να λειτουργεί ως ένας ενιαίος λογικός επιταχυντής. Το συνολικό FP4 sparse compute σε όλες τις 72 GPU υπερβαίνει τα 1.44 ExaFLOPS και η συνολική μνήμη HBM3e φτάνει τα 13.5 TB.

Κάθε module GB200 συνδυάζει έναν Grace Arm CPU με δύο dies GPU Blackwell μέσω NVLink-C2C στα 900 GB/s — εξαλείφοντας εντελώς το interface PCIe μεταξύ CPU και GPU. Ο CPU λειτουργεί ως ελεγκτής μνήμης υψηλής bandwidth και engine οργάνωσης, όχι ως εμπόδιο. Αυτός ο σχεδιασμός καθιστά το NVL72 μοναδικά ικανό για inference μοντέλων τρισεκατομμυρίων παραμέτρων με χαμηλή καθυστέρηση: ολόκληρο το μοντέλο χωράει στη μνήμη του rack, οι λειτουργίες all-reduce πραγματοποιούνται μέσα στο NVLink fabric, και δεν απαιτείται δίκτυο μεταξύ κόμβων για την εξυπηρέτηση ενός μοντέλου.

Από την άποψη της εγκατάστασης, το NVL72 απορροφά έως και 120 kW και απαιτεί άμεση υγρή ψύξη — μια αποκλειστική τροφοδοσία τριφασικού ρεύματος και υποδομή υγρής ψύξης εγκαταστάσεων είναι υποχρεωτικές. Τα οικονομικά οφέλη είναι εντυπωσιακά σε υπερκλίμακα: ένα rack NVL72 αντικαθιστά όσα απαιτούσαν προηγουμένως ολόκληρες σειρές από κόμβους DGX H100 για ανάλογη απόδοση inference.

GB200 NVL72 Προδιαγραφές

Αναλυτική Προδιαγραφή Πλήρους Ράφης

Απόγειες GPU 72 × Blackwell GB200
Τμήματα CPU 36 × Grace Arm (72 cores each)
Μνήμη GPU 13.5 TB HBM3e total
Μνήμη GPU BW 345.6 TB/s aggregate
Επιδόσεις AI 1.44 ExaFLOPS FP4 sparse
Συνδεσιμότητα GPU NVLink 5.0 — 1.8 TB/s per GPU
CPU-GPU Σύνδεση NVLink-C2C — 900 GB/s bidirectional
Μνήμη Συστήματος Up to 13.5 TB LPDDR5X
Κατανάλωση ισχύος Up to 120 kW per rack
Ψύξη Direct Liquid Cooling (mandatory)
Δικτύωση 8 × 400 GbE / InfiniBand per rack

Οδηγός Αγοραστή

Ποιος AI Server ταιριάζει καλύτερα στην περίπτωση χρήσης σας;

Από πειραματισμό σε εργαστηριακή κλίμακα μέχρι πλήρη ανάπτυξη hyperscale — ταιριάξτε το φορτίο εργασίας σας με την κατάλληλη βαθμίδα πλατφόρμας.

Έρευνα / Εργαστήριο

2–4 GPU Tower or 2U Rack

GPUδες A100 80GB / RTX PRO 6000
Μνήμη GPU 160–384 GB GPU VRAM
Ισχύς 2–4 kW total draw

Προσαρμογή μοντέλου, ανάπτυξη RAG, τοπική inference, αναπαραγωγιμότητα έρευνας. Ταιριάζει κάτω από ένα γραφείο ή σε ένα τυπικό ράφι. Συνήθως δεν απαιτούνται αναβαθμίσεις εγκαταστάσεων.

Νεοφυής Επιχείρηση / ΜΜΕ

HGX H100 OEM 8-GPU

GPUδες 8 × H100 SXM5 80GB
Μνήμη GPU 640 GB HBM2e
Ισχύς ~10 kW draw

Πλήρης προσαρμογή των μοντέλων 13–70B. Εξαγωγή παραγωγής για προϊόντα AI-native. Απαιτείται τριφασική παροχή ρεύματος ή διπλή τροφοδοσία 30A. Εξάτμιση με αερισμό με HX στην πίσω πόρτα είναι εφικτή.

Επιχείρηση

DGX H200 / HGX H200

GPUδες 8 × H200 SXM5 141GB
Μνήμη GPU 1.1 TB HBM3e
Ισχύς ~11 kW draw

Εκπαίδευση πλήρους παραμέτρου για μοντέλα 70–400B. Ερώτηση χαμηλής καθυστέρησης για πολύ μεγάλα μοντέλα. Προτεινόμενη υγρή ψύξη. Το τρέχον βιομηχανικό πρότυπο για σοβαρές εργασίες AI.

Υπερμεγέθης κλίμακα

GB200 NVL72

GPUδες 72 × Blackwell GB200
Μνήμη GPU 13.5 TB HBM3e
Ισχύς Up to 120 kW

Προ-εκπαίδευση μοντέλου με τρισεκατομμύρια παραμέτρους και inference με μεγάλα batch. Υποχρεωτικό πλήρες υγρό σύστημα ψύξης και dedicated τριφασική ισχύς. Αρχιτεκτονική rack-as-a-single-GPU μέσω NVLink 5.


Συχνές ερωτήσεις (FAQ)

Συχνές Ερωτήσεις

Το DGX (Data Centre GPU) είναι το δικό της ολοκληρωμένο σύστημα με εμπορική επωνυμία της NVIDIA — η κάρτα GPU, το NVSwitch, ο CPU, η μνήμη, η αποθήκευση, το δίκτυο, το BMC και το πλαίσιο είναι όλα συναρμολογημένα και πιστοποιημένα από την NVIDIA. Το HGX είναι η πλατφόρμα OEM: η NVIDIA προμηθεύει τη βάση πλακέτας GPU με NVSwitch και modules GPU σε συνεργάτες όπως η Supermicro, Dell EMC, HPE, και Lenovo, οι οποίοι κατασκευάζουν το δικό τους ολοκληρωμένο chassis διακομιστή γύρω από αυτό. Τα συστήματα HGX προσφέρουν μεγαλύτερη ευελιξία στην επιλογή chassis, επιλογές δικτύου και διαμορφώσεις αποθήκευσης· τα συστήματα DGX είναι πιστοποιημένα αναφοράς και έρχονται με το λογισμικό NVIDIA Base Command.

Το DGX H100 καταναλώνει έως και 10,2 kW. Απαιτούνται δύο συνδέσεις C19/C20 από ξεχωριστά κυκλώματα 30A, 240V στην Βόρεια Αμερική, ή μια τριφασική τροφοδοσία 32A στην Ευρώπη. Ένα τυπικό οικιακό κύκλωμα 20A, 120V είναι εντελώς ακατάλληλο. Σχεδιάστε για αποκλειστικά PDUs ή άμεσες τροφοδοσίες από το πάνελ, και επαληθεύστε την χωρητικότητα του UPS σας πριν την παραγγελία.

Οι entry και mid-range AI servers (διαμορφώσεις 2–8 GPU PCIe) μπορούν να χρησιμοποιήσουν ψύξη αέρα υψηλής ροής, αν και ο θόρυβος από τους ανεμιστήρες υψηλής ταχύτητας και η θερμότητα εξαγωγής στα 10 kW+ καθιστούν επιτακτική τη χρήση θερμικών ανταλλακτών στο πίσω μέρος της πόρτας. Τα DGX H100 και HGX H100/H200 σε μορφή SXM σχεδιασμένα για ψύξη αέρα σε επίπεδο συστήματος παράγουν σημαντική θερμότητα σε επίπεδο rack — η υγρή ψύξη γίνεται πρακτικά αναγκαία πάνω από 20–30 kW ανά rack. Το GB200 NVL72 στα 120 kW ανά rack απαιτεί άμεση υγρή ψύξη χωρίς επιλογή μόνο αέρα.

Στο FP16, ένα μοντέλο 175B απαιτεί περίπου 350 GB VRAM — περισσότερο από τα 640 GB που μπορεί να χωρέσει ένα DGX H100 αφού ληφθεί υπόψη το overhead της inference KV cache. Στην πράξη, η quantisation INT8 μειώνει αυτή την απαίτηση στο ~175 GB, χωρώντας άνετα. Το DGX H200 (1.1 TB HBM3e) μπορεί να τρέξει μοντέλα 175B σε FP16 με περιθώριο. Ένα GB200 NVL72 (13.5 TB) μπορεί να τρέξει πολλαπλές instances μοντέλων 175B ταυτόχρονα.

Για εκπαίδευση σε πολλαπλούς κόμβους, είναι απαραίτητο το δίκτυο υψηλής ταχύτητας RDMA fabric. NVIDIA InfiniBand HDR (200 Gb/s) ή NDR (400 Gb/s) αποτελεί το πρότυπο για δικτύωση συλλόγων DGX/HGX. Εναλλακτικά, το RoCEv2 (RDMA over Converged Ethernet) με 400 GbE ConnectX-7 NICs είναι μια επιλογή χαμηλότερου κόστους για clusters inference. Όλες οι συλλογικές λειτουργίες all-to-all (AllReduce) κατά τη διάρκεια της εκπαίδευσης είναι εξαιρετικά ευαίσθητες στην bandwidth και τη latency μεταξύ των κόμβων — η switching commodity 25/100 GbE εισάγει απαράδεκτες καθυστερήσεις σε εκπαίδευση μεγάλης κλίμακας.

Ναι. Για μεγάλες παραγγελίες AI server μπορούμε να κανονίσουμε διαμόρφωση εργοστασίου, δοκιμές burn-in και logistics προς το data centre ή το colocation facility σας. Επικοινωνήστε με την ομάδα πωλήσεών μας για να συζητήσουμε το χρονοδιάγραμμα υλοποίησης και τις απαιτήσεις εγκατάστασης. Συνεργαζόμαστε με παρόχους colocation σε όλη την Ευρώπη, τα ΗΑΕ και τη Βόρεια Αμερική.

Η ομάδα μας είναι διαθέσιμη 24/7 μέσω WhatsApp (+49 176 777 888 33), email και τηλέφωνο. Οι αγορές AI server συνήθως απαιτούν προσαρμοσμένες διαμορφώσεις και τιμές όγκου — θα ταιριάξουμε τις απαιτήσεις φόρτου εργασίας σας με την κατάλληλη πλατφόρμα και θα σας παράσχουμε μια αναλυτική προσφορά που περιλαμβάνει logistics.

Έτοιμοι να αναπτύξετε την υποδομή AI σας;

Περιηγηθείτε στη πλήρη γκάμα των πλατφορμών AI server μας παραπάνω, από ερευνητικού επιπέδου κόμβους 2-GPU μέχρι συστήματα rack-scale DGX H200 και GB200 NVL72. Η ομάδα μας θα σας βοηθήσει να σχεδιάσετε την παροχή ενέργειας, τον εξαερισμό, το δίκτυο και τη διαχείριση logistics από την αρχή μέχρι το τέλος.