در سالهای گذشته، طیف بسیار گسترده و متنوعی از سرورهای و شتابدهندههای GPU روانه بازار شدهاند که هر یک ویژگیهای خاص خود را دارند. با اینحال، برخی از آنها همچون AMD Instinct MI300X / MI325X متمایز از رقبا هستند. جالب آنکه طراحی برخی از این محصولات شبیه به شهرهای بزرگی است که آسمانخراشهایی روی آنها قرار گرفته است.
AMD Instinct MI325X 8-GPU یک پلتفرم محاسباتی پیچیده با توان عملیاتی بالا
AMD Instinct MI325X 8-GPU غول قدرتمند در دنیای پردازشها و محاسبات گرافیکی است که برای تسریع محاسبات پیچیده در حوزههای هوش مصنوعی، یادگیری ماشین و محاسبات علمی طراحی شده است. این سیستم از هشت پردازنده گرافیکی قدرتمند MI325X تشکیل شده که هر کدام با حافظه 256 گیگابایتیHBM3e همراه هستند و مجموعا ظرفیت حافظه سیستم را به رقم چشمگیر 2 ترابایت میرساند. این حجم عظیم حافظه به همراه پهنای باند بسیار بالا، امکان پردازش سریع و همزمان حجم عظیمی از دادهها را فراهم میکند. MI325X از معماری پیشرفته CDNA 3 بهره میبرد که بهینهسازی شده برای انجام محاسبات ماتریسی و برداری است و در نتیجه عملکرد بسیار بالایی در کارهای مرتبط با هوش مصنوعی از خود نشان میدهد. همچنین، این سیستم از قابلیتهای ارتباطی پیشرفتهای برخوردار است که امکان اتصال به سایر سیستمها و تشکیل خوشههای محاسباتی بزرگ را فراهم میکند. با توجه به وزن و ابعاد بسیار زیاد این سیستم، ایامدی دستههایی را برای حمل آسانتر آن در نظر گرفته است. به طور کلی، AMD Instinct MI325X 8-GPU یک پلتفرم قدرتمند و کارآمد برای پژوهشگران، دانشمندان داده و مهندسان است که به دنبال انجام محاسبات پیچیده و پردازش حجم عظیمی از دادهها هستند.
معماری CDNA 3
CDNA 3، معماری محاسباتی نسل جدیدی است که توسط ایامدی طراحی شده و به طور ویژه برای تسریع در محاسبات هوش مصنوعی و یادگیری ماشین بهینه شده است. این معماری با بهرهگیری از پیشرفتهای قابل توجه در طراحی پردازندههای گرافیکی، عملکرد بسیار بالایی را در انجام محاسبات پیچیده و چند بعدی ارائه میدهد که اساس کار بسیاری از الگوریتمهای یادگیری عمیق است. CDNA 3 با تمرکز بر افزایش کارایی انرژی و بهبود پهنای باند حافظه، امکان آموزش مدلهای پیچیده هوش مصنوعی را در زمان کمتر و با مصرف انرژی کمتر فراهم میکند. این معماری از واحدهای محاسباتی سفارشی و حافظه HBM3e با پهنای باند بالا بهره میبرد که به آن اجازه میدهد تا حجم عظیمی از دادهها را به طور همزمان پردازش کند. علاوه بر این، CDNA 3 از قابلیتهای نرمافزاری قدرتمندی پشتیبانی میکند که به توسعهدهندگان اجازه میدهد به راحتی برنامههای خود را برای این معماری بهینه کنند. با توجه به این ویژگیها، CDNA 3 به عنوان یکی از پیشرفتهترین معماریهای محاسباتی برای هوش مصنوعی شناخته میشود و پتانسیل بالایی برای تحول در حوزههای مختلفی مانند پردازش زبان طبیعی، بینایی کامپیوتری و پزشکی دارد.
حافظه HBM3e
حافظه HBM3e به طور ویژه برای پاسخگویی به نیازهای روزافزون محاسبات با کارایی بالا، به ویژه در حوزه هوش مصنوعی و یادگیری ماشین طراحی شده است. این نوع حافظه به عنوان نسل بعدی حافظههای (HBM) سرنام High Bandwidth Memory شناخته میشود و با ارائه پهنای باند بسیار بالا، ظرفیت بیشتر و مصرف انرژی کمتر، امکان پردازش سریعتر و کارآمدتر دادههای حجیم را فراهم میکند. HBM3e با استفاده از فناوری ساخت پیشرفته و طراحی چند لایه، دستیابی به تراکم بسیار بالا از سلولهای حافظه در یک ماژول کوچک را امکانپذیر کرده است. این ویژگی باعث میشود تا HBM3e بتواند حجم عظیمی از دادهها را در نزدیکی پردازنده گرافیکی یا پردازنده مرکزی قرار دهد و در نتیجه، تنگنای حافظه در سیستمهای محاسباتی سنگین را به حداقل برساند. همچنین، HBM3e از رابط ارتباطی بسیار سریع و پهنباند بهره میبرد که به آن امکان میدهد تا دادهها را با سرعت بسیار بالایی بین پردازنده و حافظه جابجا کند. از جمله مزایای کلیدی حافظه HBM3e میتوان به موارد زیر اشاره کرد:
- پهنای باند بسیار بالا: HBM3e پهنای باندی چند برابر بیشتر از حافظههای سنتی مانند DDR4 و DDR5 ارائه میدهد که برای پردازشهای سنگین و محاسبات موازی بسیار حیاتی است.
- ظرفیت بالا: با استفاده از فناوری ساخت پیشرفته، HBM3e میتواند ظرفیت بسیار بالایی را در قالب یک ماژول کوچک ارائه دهد که برای آموزش مدلهای بزرگ هوش مصنوعی و پردازش دادههای حجیم بسیار مناسب است.
- مصرف انرژی پایین: HBM3e از طریق بهینهسازی مصرف انرژی، به کاهش گرمای تولید شده در سیستم و افزایش عمر مفید آن کمک میکند.
- تاخیر کم: به دلیل قرارگیری نزدیک به پردازنده، HBM3e تاخیر بسیار کمی در دسترسی به دادهها دارد که برای برنامههای حساس به زمان بسیار مهم است.
HBM3e، به طور گستردهای در سیستمهای محاسباتی با کارایی بالا، سرورهای ابری، ایستگاههای کاری حرفهای و پردازندههای گرافیکی پرقدرت مورد استفاده قرار میگیرد. همین مسئله باعث شده تا فناوری مذکور نقش مهمی در توسعه هوش مصنوعی، یادگیری عمیق، شبیهسازیهای علمی و سایر کاربردهای محاسباتی سنگین ایفا میکند.
یک ویژگی جالب در برد 8 GPU AMD Instinct MI325X
AMD Instinct MI300X GPU با حافظه 192 گیگابایتی HBM3 در فرم فکتور OAM عرضه میشود. هشت عدد از این GPUها روی یک برد یونیورسال (UBB) قرار میگیرند. این مجموعه تقریبا مشابه پلتفرم 8 GPU NVIDIA HGX است، با این تفاوت که انودیا از معماری سوئیچ NVLink در پلتفرمهای 8 GPU HGX خود استفاده میکند.
AMD Instinct MI325X یک بهروزرسانی مبتنی بر حافظه 256 گیگابایتی HBM3e است که ظرفیت بالاتر و پهنای باند حافظه بیشتری را ارائه میدهد. این پردازنده بر مبنای یک پلتفرم بسیار مشابه عرضه میشود. در جلوی این زیرساخت، آرایه عظیمی از خنککنندهها قرار دارد که در قالب، یک قطعه بزرگ فلزی سیاه قابل مشاهده است.
در سمت دیگر یک برج فلزی مشابه وجود داره که دور خنککننده ریتایمر PCIe قرار گرفته است. شایان ذکر است که ریتایمر PCIe یک قطعه الکترونیکی است که سیگنالهای PCIe را تقویت و بازسازی میکند تا در مسافتهای طولانیتر و با سرعت بالاتر به درستی کار کنند.
کلام آخر
مونتاژ 8 شتابدهنده گرافیکی مدرن از ایامدی و انودیا فرآیندی سنگین و پیچیده به شمار میرود، اما چالش اصلی در این زمینه مبحث سرمایش است، زیرا پلتفرمهایی در این مقیاس که عمدتا در زمینه آموزش مدلهای هوش مصنوعی و شبکههای عصبی عمیق مورد استفاده قرار میگیرند به خنککنندههای مخصوصی نیاز دارند. در شرایطی که نسخههای خنککننده مایع کوچکتر به نظر برسند، در مقابل بلوکهای مسی اغلب سنگین هستند. به همین دلیل است که ایامدی دستههای مخصوصی را برای جابهجایی این غول محاسباتی در نظر گرفته است.
حمیدرضا تائبی