سرور سوپرمیکرو SYS-422GA-NBRT-LCC
امروزه، سرورهای قدرتمندی در زیرساختهای فناوری اطلاعات و مراکز داده مورد استفاده قرار میگیرند و در چند سال گذشته نیز شاهد عرضه محصولات رده بالایی بودهایم، اما سرورهای مجهز به NVIDIA HGX در نوع خود جالب توجه هستند و به لحاظ توان پردازشی به راحتی سایر سرورهای موجود در بازار را کنار میزنند. سوپرمیکرو (Supermicro) یک پلتفرم 4 یونیت با قابلیت پشتیبانی از خنککننده مایع و سوئیچهای PCIe یکپارچه طراحی کرده است تا محصولی جمعوجور و در عین حال سرویسپذیرتر از رقبا را به بازار عرضه کند. اکنون، ما سرور سوپرمیکرو SYS-422GA-NBRT-LCC را داریم، نسل بعدی پلتفرم 4 یونیت این شرکت که بر مبنای پردازندههای سری Intel Xeon 6900P و NVIDIA HGX B200 کار میکند و انتخابی ایدهآل برای کسبوکارهایی است که نیازمند توان محاسباتی سطح بالا هستند و تمایل دارند از سرور در ارتباط با کارهایی همچون آموزش مدلهای زبانی بزرگ و تحلیل کلان دادهها استفاده کنند.
سرور SYS-422GA-NBRT-LCC
سرور SYS 422GA NBRT LCC تنها یکی از محصولات رده بالای شرکت سوپرمیکرو است. این مدل مبتنی بر NVIDIA HGX H100/H200 است و تغییراتی در مقایسه با نسل قبل داشته است، به طوری که ماژولهای مدیریت I/O شبیه به USB و VGA، به جلو شاسی منتقل شدهاند.
همانگونه که در شکل بالا مشاهده میکنید، سیستم پردازنده گرافیکی 4 یونیت سوپرمیکرو برای NVIDIA HGX H100 و HGX 200 همراه با خنککننده مایع SC23 کاملا سازگار است تا بتواند گرمای تولید شده را به راحتی دفع کند. آرایه SSD نیز برای جای دادن DPUهای NVIDIA BlueField-3 به پلهای شمالی/جنوبی جلوی شاسی منتقل شدهاند. همچنین، سوپرمیکرو درایوهای بوت قابل سرویسدهی به جلو اضافه کرده است که نقش مهمی در روند انجام سادهتر کارها دارد.
تغییر بزرگ دیگر این است که نسل قبلی دارای چهار مجموعه نازل خنککننده مایع برای سینی GPU بود، در حالی که نسخه جدید تنها دو مورد دارد.
اگرچه سرور فوق یک طراحی جمعوجور دارد، اما پلتفرمهای 4 یونیت GPU سوپرمیکرو هر آن چیزی که نیاز است را روی یک سینی قرار میدهند تا بتوان به راحتی آنها را سرویس کرد. به عنوان مثال، سینی GPU به چهار جداکننده سریع تجهیز شده تا بتوان آنرا بیرون کشید و در صورت لزوم تعویض کرد. این ویژگی را با پلتفرمهایی مانند Dell PowerEdge XE9680 مقایسه کنید که در آن کل شاسی باید حداقل تا حدی از رک خارج شود و برای سرویسدهی سینی HGX باید جداسازی به شکل کامل انجام شود.
همانگونه که در شکل زیر مشاهده میکنید، در این نسل یک راهحل بلوک خنککننده مایع جدید در نظر گرفته شده است تا فرآیند دفع گرما و استقرار تجهیزات به شکل دقیقتری انجام شود.
سینی پردازنده مرکزی به وضوح به شکل صریح و روشن پیکربندی نشده است، اما میتوانیم بلوکهای خنککننده مایع جدید Intel Xeon 6900P و همچنین فنهایی که برای دفع گرمای تجهیزاتی مثل حافظههای اصلی، ذخیرهسازی و کارتهای شبکه تعبیه شدهاند را مشاهده کنیم. فنها فقط نیاز به خنک کردن این بخش از شاسی دارند، زیرا منبع تغذیه حداقل جریان هوای مورد نیاز را در قسمت بالایی تامین میکند.
ویژگی جالب دیگری که سوپرمیکرو در طراحی سرور جدید مورد توجه قرار داده، این است که میتوان یک DIMM را بدون خارج کردن شاسی از رک تعویض کرد. بسیاری از پلتفرمها بر مبنای رویکرد دسترسی از بالا از طریق یک درپوش استفاده میکنند که باید از رک خارج شود تا سرویسدهی شود، اما قابلیت جدید کار تکنسینهای شبکه را ساده کرده است.
نوآوری دیگری که سوپرمیکرو از نسل قبلی خود به ارث برده است این است که سوئیچهای PCIe Broadcom، خنککننده مایع هستند و روی خود مادربرد قرار دارند. اکثر سرورهای هوش مصنوعی امروزی از یک سوئیچبرد PCIe جداگانه استفاده میکنند که کابلکشی شدهاند و اغلب در سرورهای خنککننده هوا مایع برای کاهش دمای تجهیزات مورد استفاده قرار میگیرند. ادغام سوئیچها در مادربرد به سوپرمیکرو اجازه میدهد تا کابلها را حذف کند که گاهی اوقات تعداد زیادی نقطه اتصال را به وجود میآورند. در پشت سرور، چهار ماژول منبع تغذیه را مشاهده میکنیم که هر کدام دارای دو ورودی هستند. این منابع تغذیه به راحتی قابل جدا شدن هستند و از hot aisle جدا هستند.
همچنین، در پشت شاسی، روی یک سینی قابل تعویض، ماژولهای شبکهسازی اصلی شرق به غرب را داریم. در اینجا، میتوانیم هشت NIC NVIDIA را مشاهده کنیم که هر کدام دارای یک پورت هستند. لازم به توضیح است که تولیدکنندگان سرورها و تجهیزات زیرساختی همچنان از سوئیچهای 51.2T استفاده میکنند مانند Marvell Teralynx 10 64-port 800GbE Switch، اما شبکهسازی در خوشههای هوش مصنوعی مباحث بزرگ و پیچیدهتری است.
کلام آخر
Supermicro SYS-422GA-NBRT-LCC نسل بعدی پلتفرمهای سطح بالایی است که برای پاسخگویی به نیازهای مراکز داده طراحی شده است. این محصول به جای تعویض مادربرد و بلوکهای خنککننده مایع، بر قابلیت سرویسدهی تاکید دارد و تعویض سریعتر را پیشنهاد میدهد، در حالی که از یکپارچهسازی به ویژه در ارتباط با خنککنندههای مایع پشتیبانی میکند. به اعتقاد ما، نسل بعدی پلتفرم برتر NVIDIA HGX H100/H200 با خنککننده مایع است. بنابراین، مشاهده نسخه HGX B200 را باید یک جهش بزرگ در این زمینه تصور کنیم.