پردازندههای Xeon 6
خانوادهی جدید پردازندههای Xeon 6 چند هفته پیش با جایگزین کردن برند قدیمی “Scalable” معرفی شدند. این خانواده شامل دو سری تراشه است؛ Sierra Forest که از هستههای E و Granite Rapids که از هستههای P استفاده میکند. در این بررسی، ما نمونههای اولیهای از پردازندههای Sierra Forest از جمله مدل ردهبالای 6780E با 144 هسته را مورد آزمایش قرار دادیم.
پردازندههای Xeon 6 برای پشتیبانی از تقریبا تمام کاربردها، از هوش مصنوعی گرفته تا پردازشهای سبکتر در لبهی شبکه، طراحی شدهاند. اینتل برای راهنمایی مشتریان، سری Sierra Forest را تحت عنوان “بهینهشده برای دستیابی به عملکرد موردنیاز-به ازای هر وات برق مصرفی در محاسبات با تراکم بالا و حجم کاری مقیاسپذیر” معرفی کرده است. در مقابل، پردازندههای P-Core سری Granite Rapids “برای دستیابی به عملکرد بالا به ازای بهکارگیری هر هسته با هدف انجام محاسبات سنگین” بهینه شدهاند. با این حال، تمام پردازندههای Xeon 6 از یک پلتفرم و فریمویر مشترک استفاده میکنند.
برای درک بهتر عملکرد این پردازندهها، اینتل Sierra Forest را جایگزینی عالی برای سیستمهایی میداند که در چرخهی بهروزرسانی ۵ ساله قرار دارند. پردازندههایی که دستیابی به عملکرد بالا و مصرف انرژی پایین را تضمین میکنند. عرضهی سری پردازندههای Xeon 6 به شکل مرحله به مرحله است، به این صورت که ابتدا خانوادهی 6700E عرضه میشود و قرار است پردازندههای Intel Xeon 6900P در سهماهه سوم امسال عرضه شوند. همچنین، انتظار داریم شاهد سیل تراشههای دیگر مانند 6900E، 6700P، 6500P، Xeon 6 SoC و 6300P در سهماهه اول ۲۰۲۵ باشیم.
نوآوریهای معماری در پردازندههای Xeon 6
خانوادهی پردازندههای Xeon 6 دو طراحی میکرومعماری را معرفی میکند: هستههای با عملکرد بالا (P-core) و یک پلتفرم هستههای با کارایی بالا (E-core). این رویکرد ترکیبی به مراکز داده اجازه میدهد تا رکهایی را طراحی کنند که در آن، کارهای محاسباتی سنگین مانند هوش مصنوعی و محاسبات با عملکرد بالا (HPC) از حداکثر راندمان بهرهمند شوند، در حالی که وظایف با حجم پردازش بالا مانند میکروسرویسها و شبکه به سطح جدیدی از بازده انرژی دست یابند.
افزایش تعداد هستهها
ویژگی برجستهی پردازندههای Xeon 6 Sierra Forest، افزایش قابل توجه تعداد هستهها است. با ادغام هستههای بیشتر در هر پردازنده، اینتل به مراکز داده این امکان را میدهد تا طیف گستردهتری از کارها را به طور همزمان مدیریت کنند. این افزایش تراکم هسته به ویژه برای برنامههایی که نیازمند سطوح بالایی از پردازش موازی هستند، مفید است و اطمینان میدهد که منابع برای به حداکثر رساندن توان عملیاتی و به حداقل رساندن تأخیر بهینه استفاده میشوند.
بهبود پهنای باند حافظه
برای چند نسل به نظر میرسید که در سرعتهای پایینتر DRAM سرور گیر کردهایم، در حالی که بازار مصرفی به سرعتهای بالای ۷۰۰۰ مگا ترانسفر بر ثانیه دست پیدا کرده است. ادغام حافظهی DDR5 با Ultra-Path Interconnect (UPI) 2.0 در پردازندههای Xeon 6 Sierra Forest پهنای باند حافظه را به طور قابل توجهی افزایش میدهد. این امر امکان دسترسی سریعتر به دادهها را فراهم میکند و گلوگاهها را کاهش میدهد و اطمینان میدهد که برنامههای با عملکرد بالا میتوانند به طور روان اجرا شوند. پهنای باند بهبود یافتهی حافظه برای برنامههایی که با کلان دادهها کار میکنند و نیازمند بازیابی و پردازش سریع دادهها هستند، مانند آموزش هوش مصنوعی و تجزیه و تحلیل کلان دادهها، حیاتی است.
قابلیتهای I/O پیشرفتهی اینتل Xeon 6
پشتیبانی از PCIe 5.0 و Compute Express Link (CXL) 2.0 و بهبود عملکرد عملیات I/O از مزایای شاخصی است که پردازندههای Xeon 6 Sierra Forest در اختیار شرکتها قرار میدهند. PCIe 5.0 دو برابر پهنای باند بهتری نسبت به نسل قبلی ارائه میدهد و ارتباط سریعتر بین پردازنده و دستگاههای جانبی را امکانپذیر میکند. CXL 2.0 با فراهم کردن یک اتصال با پهنای باند بالا و با تاخیر کم برای پردازندهها، شتابدهندهها، حافظه و ذخیرهسازی، سرعت انتقال اطلاعات را به شکل قابل توجهی افزایش میدهد. بنابراین، این اطمینان خاطر را میدهد که مراکز داده میتوانند به نیازهای برنامههای مدرن و پرسرعت پاسخ دهند و با فناوریهای آینده به طور یکپارچه ادغام شوند.
معماری چندقالبی ماژولار
پردازندههای Xeon 6 Sierra Forest از یک معماری چند-تراشهای یا به عبارت دقیقتر Multi-Die ماژولار بهره میگیرند که با فناوری پل ارتباطی چند-تراشهای تعبیهشده (EMIB) فعال شده است. این طراحی امکان ترکیب چندین دای (die) در یک بسته را فراهم میکند و در عین حال مصرف انرژی را بهینه نگه میدارد و پهنای باند بالا و تاخیر کم را ارائه میدهد. معماری مذکور، رویکرد ماژولار، انعطافپذیر و مقیاسپذیر را به ارمغان میآورد و به مراکز داده اجازه میدهد تا زیرساخت خود را برای پاسخگویی به نیازهای خاص کاری سفارشی کنند. این معماری همچنین از مدیریت حرارتی بهتر و بهرهوری انرژی پشتیبانی میکند که برای حفظ عملکرد و قابلیت اطمینان در محیطهای با تراکم بالا بسیار مهم است.
معماری داخلی پردازندههای Xeon 6 Sierra Forest
بررسی معماری داخلی پردازندههای Xeon 6 Sierra Forest، دیدگاه جالبی در مورد رویکرد نوآورانهی اینتل برای به حداکثر رساندن عملکرد و کارایی ارائه میدهد. برخلاف واسطه سیلیکونی بزرگ سنتی، فناوری EMIB از یک دای پل کوچک با چندین لایه مسیریابی استفاده میکند. اینتل با استفاده از این فناوری میتواند چندین دای را در یک بسته واحد به هم متصل کند، در نتیجه اندازهی کلی بسته را کاهش داده و یکپارچگی سیگنال را بهبود بخشیده است. این پیکربندی امکان انتقال سریعتر دادهها بین دایها را فراهم میکند که برای حفظ عملکرد بالا در طیف وسیعی از برنامهها ضروری است.
پردازندههای نسل جدید چه اهمیتی برای مراکز داده دارند؟
عملکرد و کارایی پردازندههای Xeon 6
پردازندههای Xeon 6 در مقایسه با نسلهای قبلی، تا ۲.۷ برابر عملکرد بیشتری را در هر وات ارائه میدهند که آنها را برای استنتاج هوش مصنوعی، انجام کارهای گرافیکی پیشرفته و کارهای محاسباتی عمومی ایدهآل میکند. این تعادل باعث میشود مراکز داده بتوانند با مصرف انرژی کمتر، کارهای بیشتری را انجام دهند که به طور مستقیم به کاهش هزینههای عملیاتی و بهبود پایداری محیطی منجر میشود.
مقیاسپذیری و انعطافپذیری
معماری ماژولار به مراکز داده اجازه میدهد تا زیرساخت خود را بر اساس نیازهای خاص کاری سفارشی کنند. امکان استقرار ترکیبی هستههای P و E در پلتفرمها، خطمشی کارآمدی در ارتباط با مدیریت نیازهای محاسباتی متنوع ارائه میدهد و باعث افزایش عملکرد و کارایی میشود. این رویکرد، اجازه میدهد شاسیها را به گونهای انتخاب و پیکربندی کنیم که برخی از آنها بتوانند با پردازندههای E-core برای اجرای کارآمد سرویسهای اصلی و مدیریت عملیات در زمانهای کاهش پیک در دسترس باشند، در حالی که برخی دیگر با پردازندههای P-core برای مدیریت تقاضا در ساعات اوج پیک و کارهای محاسباتی سنگین کار کنند.
امنیت و قابلیت اطمینان پیشرفته
پردازندههای Xeon 6 که با ویژگیهای امنیتی تقویتشده سختافزاری ساخته شدهاند، مکانیزم محافظتی قدرتمندی برای یکپارچگی دادهها و قابلیت اطمینان سیستم ارائه میدهند. این امر برای حفظ اعتماد و انطباق با قوانین در محیطهایی که دادههای حساسی را میزبانی میکنند ضروری است.
آیندهنگری با فناوریهای پیشرفته
پردازندههای Xeon 6 با پشتیبانی از آخرین فناوریها مانند DDR5، PCIe 5.0 و CXL 2.0، اطمینان میدهند که مراکز داده برای همسو شدن با پیشرفتهای آینده آماده هستند و میتوانند به طور یکپارچه با راهحلهای سختافزاری و نرمافزاری نوظهور ادغام شوند.
راهحلهای مدرن برای مشکلات امروزی
پردازندههای Intel Xeon 6 Sierra Forest گام بزرگی در پیشرفت معماری مراکز داده به شمار میروند. آنها با ترکیب عملکرد بالا، کارایی انرژی و مقیاسپذیری، به نیازهای چندوجهی مراکز داده مدرن پاسخ میدهند و مسیر را برای بهبود بهرهوری عملیاتی، کاهش هزینهها و توانایی مدیریت تقاضای رو به رشد هوش مصنوعی و سایر برنامههای محاسباتی سنگین هموار میکنند.
جدول مدلهای E-core پردازندههای Intel Xeon 6
تمام مدلهای Sierra Forest دارای E-Core با 88 خط PCIe Gen5/CXL هستند. جدول زیر ویژگیهای فنی پردازندههای مذکور را به همراه مدلها، تعداد هستهها، فرکانس محاسباتی و حافظههایی که پشتیبانی میکنند نشان میدهند.
SKU | Cores | Base GHz | Turbo GHz | Max Turbo GHz | L3 Cache MB | TDP Watts | Max Scala. | DDR5 Mem Speed 1DPC |
6780E | 144 | 2.2 | 3.0 | 3.0 | 108 | 330 | 2S | 6400 |
6766E | 144 | 1.9 | 2.7 | 2.7 | 108 | 250 | 2S | 6400 |
6756E | 128 | 1.8 | 2.6 | 2.6 | 96 | 225 | 2S | 6400 |
6746E | 112 | 2.0 | 2.7 | 2.7 | 96 | 250 | 2S | 5600 |
6740E | 96 | 2.4 | 3.2 | 3.2 | 96 | 250 | 2S | 6400 |
6731E | 96 | 2.2 | 3.1 | 3.1 | 96 | 250 | 1S | 5600 |
6710E | 64 | 2.4 | 3.2 | 3.2 | 96 | 205 | 2S | 5600 |
تست عملکرد پردازندههای Xeon 6
در این بررسی، دو مجموعه پردازنده برای آزمایش در اختیار تیم ما قرار گرفت: 6780E و 6766E. اینتل یک پلتفرم سرور QCT را برای تست ارائه داد. ابتدا ضروری است به چند نکتهی کلیدی در مورد دادههایمان اشاره کنیم. پلتفرم سرور در بسیاری از محیطهای تست ما ناپایدار بود. برای مثال، به درستی از Windows Server 2022 پشتیبانی نمیکرد و ما مجبور شدیم از نسخه 2025 استفاده کنیم.
پردازندههای ارسالی برای بررسی، نمونههای اولیه هستند و نسخههای نهایی تجاری که به صورت بستهبندی به فروش میرسند، نیستند. به همین دلیل، قادر به اجرای کامل مجموعه تستهای خود نبودیم و زمان کافی برای ریشهیابی کامل مشکلات، عملکرد و پایداری در اختیار نداشتیم. بنابراین، دادههای زیر باید به عنوان راهنمای کلی در نظر گرفته شوند و نباید به عنوان نتایج نهایی مورد بررسی قرار گیرند. ما تا زمان دریافت پلتفرمهای سرور نهایی از شرکای تجاری اینتل (OEMها)، برای صدور یک ارزیابی نهایی در مورد قابلیتهای پردازندههای Sierra Forest صبر خواهیم کرد.
اینتل برای نمایش قابلیتهای پردازندههای جدید، یک سیستم Quanta QuantaGrid D55Q-2U را به عنوان پلتفرم تست در اختیار ما قرار داد. این سرور دارای یک بکپلن 24 سینی برای اتصال مستقیم NVMe است که از U.2 Gen4/Gen5 SSDs پشتیبانی میکند.
پیکربندی تست ما شامل 16 ماژول حافظه رم DDR5-6400 با ظرفیت 16 گیگابایت به ازای هر ماژول بود. نوع ماژولهای رم استفاده شده Micron MTC10F1084S1RC64BDY بود.
به دلیل مشکلات و ناپایداریهای موجود در پلتفرم تست اولیه، پردازندههای جدید Xeon 6780E و 6766E در محیط Windows Server 2025 مورد آزمایش قرار گرفتند، در حالی که پردازندههای نسل قبل در محیط Windows Server 2022 تست شده بودند.
تست با نرمافزار Blender OptiX 4.0
در تست با نرمافزار Blender OptiX 4.0، سه سناریو مختلف به نامهای Monster، Junkshop و Classroom اجرا شد.
در سناریوی Monster، پردازندههای 6780E و 6766E به ترتیب نسبت به پردازندهی +8592، 21% و 14% عملکرد بهتر نشان دادند. همچنین در این سناریو، پردازندهی 6780E حدود 18% نسبت به 6766E عملکرد بالاتری داشت.
در سناریوی Junkshop، پردازندهی 6780E نسبت به 8592+، 10.5% عملکرد بهتر داشت، در حالی که پردازندهی 6766E تنها 0.35% ضعیفتر از +8592 عمل کرد. در این سناریو نیز، پردازندهی 6780E حدود 10.8% نسبت به 6766E عملکرد بالاتری داشت.
در نهایت، در سناریوی Classroom، پردازندههای 6780E و 6766E به ترتیب نسبت به پردازندهی +8592، 20% و 22% عملکرد بهتر را نشان دادند. همچنین در این سناریو، پردازندهی 6780E حدود 10% نسبت به 6766E عملکرد بالاتری داشت.
Blender 4.0 CPU | 2x Xeon 6780E (256GB DDR5) | 2x Xeon 6766E (256GB DDR5) | 2x Xeon Platinum 8592+(ER) (R760 – 1TB DDR5 4800MHz) | 2x Xeon Platinum 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz) | 2x Xeon Gold 6430(SR) (R760 – 1TB DDR5 4800MHz) |
Monster | 1410.463 | 1297.715 | 1115.057 | 943.300 | 540.039 |
Junkshop | 862.418 | 777.716 | 780.408 | 627.662 | 361.066 |
Classroom | 696.543 | 628.960 | 556.550 | 475.144 | 278.228 |
تست Cinebench R23 برای ارزیابی عملکرد چند هستهای (Multi-Core) پردازندهها انجام شد. در این تست، پردازندههای 6780E و 6766E به ترتیب 38% و 42% ضعیفتر از پردازندهی +8592 ظاهر شدند.
برای عملکرد تک هستهای (Single-Core) نیز، پردازندههای 6780E و 6766E به ترتیب 24% و 31% ضعیفتر از پردازندهی +8592 عمل کردند. همچنین، در این تست، پردازندهی 6780E حدود 5% در عملکرد چند هستهای و 18% در عملکرد تک هستهای نسبت به پردازندهی 6766E عملکرد بهتری داشت.
Cinebench R23 | 2x Xeon 6780E (256GB DDR5) | 2x Xeon 6766E (256GB DDR5) | 2x Xeon Platinum 8592+(ER) (R760 – 1TB DDR5 4800MHz) | 2x Xeon Platinum 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz) | 2x Xeon Gold 6430(SR) (R760 – 1TB DDR5 4800MHz) |
CPU Multi Core | 67,984 | 64,326 | 110,498 | 79,164 | 69,663 |
CPU Single Core | 873 | 793 | 1,144 | 1,461 | 1,022 |
MP Ratio | 77.91x | 81.10x | 96.63x | 54.20x | 68.17x |
Cinebench 2024
تست Cinebench 2024 برای ارزیابی عملکرد چند هستهای (Multi-Core) پردازندهها انجام شد. نتایج این تست نشان میدهد که در مقایسه با پردازندهی +8592، عملکرد چند هستهای پردازندههای 6780E و 6766E به ترتیب حدود 55% و 61% کاهش یافته است. همچنین در این تست، پردازندهی 6780E حدود 13% نسبت به پردازندهی 6766E عملکرد بهتری داشت. برای عملکرد تک هستهای (Single-Core)، هر دو پردازندهی 6780E و 6766E تقریبا عملکرد مشابهی داشتند و تنها 5% با هم اختلاف داشتند. با این حال، در مقایسه با پردازندهی +8592، عملکرد تک هستهای پردازندههای 6780E و 6766E به ترتیب 37% و 34% کاهش یافته است.
Cinebench R23 | 2x Xeon 6780E (256GB DDR5) | 2x Xeon 6766E (256GB DDR5) | 2x Xeon Platinum 8592+(ER) (R760 – 1TB DDR5 4800MHz) | 2x Xeon Gold 6430(SR) (R760 – 1TB DDR5 4800MHz) | 2x Xeon Platinum 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz) |
CPU Multi Core | 2,687 | 2,347 | 6,001 | 3,746 | 4,699 |
CPU Single Core | 43 | 45 | 68 | 59 | 76 |
MP Ratio | 62.85x | 52.65x | 88.48x | 63.22x | 61.44x |
Y-Cruncher
Y-Cruncher یک نرمافزار محبوب برای بنچمارک و تست پایداری است که از سال ۲۰۰۹ در دسترس قرار گرفته است. نرمافزاری که در زمینه تست چند-رشتهای و مقیاسپذیر و همچنین محاسبه عدد پی و سایر ثابتهای ریاضی تا مقیاس تریلیونها رقم را انجام میدهد. در این تست، هرچه سرعت بالاتر باشد، عملکرد بهتر است. پردازندههای جدید 6780E و 6766E کمی کندتر از پردازندهی Emerald Rapids 8592+ عمل میکنند، اما به شکل مستقیم رقیب یکدیگر نیستند. در تست محاسبهی 1 میلیارد رقم Pi، پردازندهی 6780E حدود 13% سریعتر از Xeon Gold 6430 و تقریبا 39% کندتر از +Xeon Platinum 8592 عمل کرد. همچنین پردازندهی 6766E، 19% کندتر از Gold 6430 و 42% کندتر از +Platinum 8592 بود.
Y-Cruncher (lower is better) | Xeon 6780E (256GB DDR5) | Xeon 6766E (256GB DDR5) | 2x Xeon Platinum 8592+(ER) (R760 – 1TB DDR5 4800MHz) | 2x Xeon Gold 6430(SR) (R760 – 1TB DDR5 4800MHz) | 2x Xeon Platinum 8480+(SR) (ML350 G11 – 256GB DDR5 4400MHz) |
1 Billion | 6.927 seconds | 7.254 seconds | 4.239 seconds | 6.060 seconds | 5.136 seconds |
2.5 Billion | 17.898 seconds | 19.507 seconds | 11.466 seconds | 16.896 seconds | 13.768 seconds |
5 Billion | 38.454 seconds | 41.116 seconds | 25.325 seconds | 36.843 seconds | 29.889 seconds |
10 Billion | 81.146 seconds | 87.403 seconds | 54.921 seconds | 80.574 seconds | 65.194 seconds |
25 Billion | 217.530 seconds | 238.813 seconds | 156.923 seconds | 229.017 seconds | 186.841 seconds |
50 Billion | 565.913 seconds | 502.245 seconds | N/A | N/A | N/A |
کلام آخر
معرفی سری جدید پردازندههای میانرده و کممصرف E-core اینتل Xeon 6، که بخشی از خانوادهی Sierra Forest محسوب میشوند، با رویهی معمول گذشته متفاوت است. در گذشته، اینتل معمولا ابتدا پردازندههای قدرتمند خود را معرفی میکرد؛ اما این بار، اینتل با مدلهای میانرده و کارآمد وارد میدان شده است. با وجود این، پردازندههای Sierra Forest حتی در مقایسه با نسل قبلی مدلهای مقیاسپذیر نسل پنجم، عملکرد خوبی از خود نشان میدهند. اما از دیدگاه اینتل، مشتریان به دنبال مقایسهی این پردازندهها با سیستمهای 5 سالهای هستند که در حال بازنشستگیاند و از پردازندههایی مانند Intel Xeon 8280 استفاده میکنند. در مقایسه با آن سیستمها، پردازندههای E-Core Xeon 6 صرفهجویی قابل توجهی در تراکم و مصرف انرژی ارائه میدهند.
در این بررسی، ما با پردازندههای بسیار اولیه و یک سرور کار میکردیم که برای معرفی اولیهی Sierra Forest مناسب بود، اما برای یک بررسی کامل ایدهآل نبود. با وجود باگهایی در سیستمعامل ویندوز (که در تستهای اوبونتو وجود نداشت) و نیاز به ویرایشهای بایوس، مشخص است که جای پیشرفت و بهبود عملکرد این پردازندهها وجود دارد. با این پیشنمایش کوچک، ما در مورد تواناییهای فعلی Sierra Forest و عملکردی که پردازندههای Granite Rapids میتوانند در اواخر سال جاری ارائه دهند، خوشبین هستیم. همچنین، نباید سری 6900 با 288 هستهی E-Core را که در ماههای آینده عرضه خواهد شد را نادیده گرفت. با این توصیف باید بگوییم که اینتل به مشتریان خود گزینههای بیشتری نسبت به گذشته برای تنظیم زیرساخت برای برنامههای کاربردیشان ارائه خواهد داد.
نویسنده: حمیدرضا تائبی