AMD Zen 5 - هستههای پردازنده جدید
ایامدی ادعا میکند بر مبنای استراتژی فوق، در مجموعهای از وظایف، شاهد افزایش 16 درصدی IPC (شامل دستورات اجرا شده در هر سیکل) بوده است.
AMD Zen 5، بهبود عملکرد
بخش کوچکتری از بهبود عملکرد در Zen 5 مربوط به قابلیتهای بهتر پیشبینی دنباله دستور و واکشی (fetch) به همراه انشعاب (branch) است. با این حال، بخش قابل توجهی از این بهبود به لطف لولهی رمزگشای دوگانهی بهتر و حافظه کش کد (Opcache) حاصل میشود. علاوه بر این، بخش دیگری از بهبود عملکرد به لطف موتور توزیع (dispatch) و اجرا (execute) حاصل میشود که برای افزایش توان عملیاتی با تعداد هستههای ثابت تعبیه شده است. همچنین، ایامدی روی کش L1 کار کرده است تا اطمینان حاصل شود که واحدهای اجرایی به درستی تغذیه میشوند. در Zen 5، کشهای L1 و L2 خصوصی هستند و کش L3 از یک سطح اشتراکی استفاده میکند. طراحیهای فعلی برای هستههای Zen 5 و Zen 5c کشهای L3 جداگانه خواهند داشت تا به هر کدام اجازه دهد به اهداف عملکردی و بهینهسازی مصرف انرژی متفاوت دست پیدا کنند. همچنین، ذکر این نکته ضروری است که ایامدی برای مواردی مانند AVX-512 از یک مسیر داده کامل 512 بیتی استفاده میکند، به جای “پمپ کردن دوگانه” یک مسیر 256 بیتی.
البته، Zen 5 و Zen 5c پایه و اساس خانواده AMD Turin خواهند بود که قرار است اواخر سال 2024 به بازار عرضه شوند. پردازندههای جدیدی که افزایش 16 درصدی IPC و 33 درصد هسته بیشتر را تضمین میکنند. بنابراین، شاهد عرضه پردازندههای 128 هستهای Zen 5 خواهیم بود که حدود 50 درصد سریعتر از Genoa 96 هستهای هستند.
Zen 5 برای ایامدی بسیار مهم خواهد بود. ایامدی در سپتامبر 2024 با عرضه خط 128 هستهای P-core Granite Rapids-AP توسط اینتل، تاج عملکرد سرور را از دست خواهد داد. بهترین حدس ما این است که Granite Rapids-AP حدود ماه نوامبر در جریان برگزاری رویداد Intel Innovation عرضه شود. ایامدی نمیخواهد برای مدت طولانی از بازار عقب بماند. بنابراین انتظار داریم که Turin در جریان رویداد Supercomputing 2024 در نوامبر معرفی شود. این اولین بار در هفت سال گذشته است که ایامدی و اینتل در تعداد هستههای P در مرکز داده برابر خواهند بود. با این حال، رویداد لسآنجلس در مورد دسکتاپ و موبایل نیز بود. بنابراین، بهتر است بهروزرسانی RDNA 3.5 را نیز مورد بررسی قرار دهیم.
AMD RDNA 3.5 - پردازنده گرافیکی iGPU بهروز شده
AMD RDNA 3.5 نسخه بهروزرشده AMD Radeon 780M است و با توجه به اینکه تغییرات جزیی در آن اعمال شده از .5 برای توصیف آن استفاده شده است، زیرا تمرکز اصلی بر بهبود عملکرد و همچنین عملکرد بر وات بوده است. ایامدی میگوید برخی از مولفههای RDNA 3.5 مورد بازبینی قرار گرفتهاند که نتیجه آن بهبود 19 تا 32 درصد سریعتری عملکرد بوده که جهش بزرگی به شمار میرود.
AMD RDNA 3.5 در بخشهای مختلف عملکرد را بهبود میدهد. نکتهی جالب این است که ایامدی به این موضوع توجه کرده که چگونه IP پردازندهی گرافیکی گوشیهای هوشمند آن از تکنیکهای بهینهسازی برای سادهسازی درخواستها به حافظه استفاده میکند، که این درخواستها معمولا انرژی زیادی مصرف میکنند. بنابراین، سعی کرده است یک GPU با مصرف انرژی کمتر طراحی کند، در حالی که ویژگی برجسته سری AMD Ryzen AI 300 و در واقع شتابدهنده NPU XDNA 2 را در آن قرار دهد.
چرا NPU AMD XDNA
ایامدی میگوید: «XDNA 2 جدید مصرف انرژی را تا دو برابر بهتر کرده و ظرفیت محاسباتی را پنج برابر بهبود بخشیده است». شایان ذکر است که معماری AMD XDNA AI شبیه تکامل موتورهای هوش مصنوعی Xilinx است. تعدادی موتور هوش مصنوعی با یک بافت و حافظه وجود دارد. ایامدی حافظه NPU را در ارقام کش تراشه دیگر قرار نمیدهد و به شکل متمایز به آنها اشاره میکند.
به لطف نسل دوم XDNA، امکان پارتیشنبندی NPU برای داشتن مجموعههای مختلف موتورهای هوش مصنوعی که ویژگیهای متفاوتی را با سرعت بالا در اختیار قرار میدهند، امکانپذیر میشود. به طوری که یک معماری جریان داده و یک اتصال قابل برنامهریزی در دسترس خواهد بود. معماری پارتیشنبندی جالب توجه خواهد بود، زیرا هنگامی که دموهای مربوط به پردازندههای هوش مصنوعی در اواخر 2024 را مشاهده خواهید کرد، متوجه میشوید که سرعت آنها در زمینه اجرای محاسبات تا چه اندازه افزایش داشته است. به بیان دقیقتر، در آینده شاهد اجرای همزمان چندین مدل روی یک کامپیوتر خواهیم بود.
ایامدی برای حل کردن چالشهای همیشگی بین دقت و عملکرد که در استفاده از فرمتهای دادهای وجود دارد، فرمت دادهای جدیدی به نام Block Floating Point 16 یا به اختصار Block FP16 را ارائه کرده است. توجه داشته باشید که این فرمت با bfloat16 (بِفلوت 16) متفاوت است و به ایامدی اجازه میدهد تا NPUها را بدون مشکل به تراشههای خود وارد کند.
کلام آخر
ایامدی دارای سه گانه معماری جدیدی است که IP CPU، GPU و NPU را هدف قرار دادهاند. Zen 5 و Zen 5c همه چیز را از CPUهای سرور تورین رده بالا تا CPUهای دسکتاپ Ryzen 9000 و CPUهای موبایل و تعبیه شده Ryzen AI 300 پوشش میدهد. بنابراین، کاملا روشن است که در سال آتی شاهد رقابت دو شرکت اینتل و ایامدی در زمینه طراحی پردازندههایی خواهیم بود که به طور خاص برای انجام محاسبات سریعتر هوش مصنوعی تولید خواهند شد.