اینتل نسل جدید پردازنده‌های Xeon 6 و Gaudi 3 را معرفی کرد

پردازنده‌های Xeon 6 و Gaudi 3
فهرست مطالب

پردازنده‌های Xeon 6 و Gaudi 3

در حالی که اخبار مختلفی در مورد پیشنهاد سرمایه‌گذاری چند میلیارد دلاری از سوی کوالکام منتشر شده و همچنین خبرهایی مبنی بر خرید اینتل مورد توجه رسانه‌ها قرار گرفته است، اما این شرکت به طور رسمی از پردازنده‌های Gaudi 3 و Xeon 6 رونمایی کرد. هر دو این تراشه‌ها برای پاسخ‌گویی به تقاضای رو به رشد محاسبات هوش مصنوعی و رقابت با شرکت‌هایی مانند انویدیا و ای‌ام‌دی طراحی شده‌اند.

اینتل اعلام کرده است که پردازنده Xeon 6 تحت عنوان Granite Rapids با هسته‌های عملکردی (P-cores) دو برابر عملکرد بهتری نسب به نسل قبلی دارند. این در حالی است که تعداد هسته‌ها افزایش‌یافته، پهنای باند حافظه دوبرابر شده و قابلیت‌های شتاب‌دهنده هوش مصنوعی نیز در خود هسته‌ها قرار گرفته‌اند.

در سویی دیگر، شتاب‌دهنده هوش مصنوعی Gaudi 3 را داریم که برای هوش مصنوعی مولد طراحی و مجهز به 64 هسته پردازشی تانسور (TPCs) و هشت موتور ضرب ماتریسی (MMEs) برای انجام محاسبات شبکه‌های عصبی عمیق است. این پردازنده، به طور اختصاصی برای اپراتورهای مخابراتی، شرکت‌های بزرگ فعال در زمینه ساخت مدل‌های هوشمند و مراکز داده بزرگی که روزانه به میلیون‌ها تراکنش پاسخ می‌دهند در نظر گرفته شده است.

در شرایطی که اینتل در حوزه ساخت تراشه‌ها، رقابت شدیدی با انویدیا و ای‌ام‌دی دارد، اما در حوزه‌های دیگر با چالش‌های جدی روبرو است. گزارش‌ها حاکی از آن است که شرکت سرمایه‌گذاری Apollo Global Management پیشنهاد سرمایه‌گذاری 5 میلیارد دلاری به اینتل داده که باعث افزایش ارزش سهام این شرکت شده است. در عین حال، هفته گذشته گزارش شد که غول تراشه‌های تلفن همراه، کوالکام، با پیشنهاد خرید به اینتل نزدیک شده است. پیشنهاد آپولو توسط برخی به عنوان یک انتخاب راهبردی از سوی پت گلسینگر، که اوایل سال 2021 مسئولیت این شرکت را بر عهده گرفت، و همچنین به عنوان پاسخی احتمالی به پیشنهاد کوالکام دیده می‌شود.

Gaudi 3 دارای 128 گیگابایت حافظه HBM2e برای آموزش و استنتاج و 24 پورت اترنت 200 گیگابیت برای شبکه‌سازی مقیاس‌پذیر است. همچنین، اینتل اعلام کرد که Gaudi 3 با فریمورک برنامه‌نویسی PyTorch و مدل‌های ترانسفورمر و دیفیوزر Hugging Face سازگار است.

اینتل ادعا می‌کند که GPU جدیدش نسبت به GPU H100 انویدیا، از نظر هزینه/عملکرد مقرون به صرفه‌تر است. به عنوان مثال، اینتل می‌گوید که Gaudi 3 در مدل زبانی بزرگ LLaMA 3 8B متا، 1.09 برابر توان عملیاتی استنتاج و 1.8 برابر عملکرد بهتر به ازای هر دلار ارائه می‌دهد. با این حال، اینتل داده‌های مقایسه‌ای بین Gaudi 3 و Blackwell، تراشه برتر GPU انویدیا که قرار است در نیمه اول سال آینده عرضه شود را ارائه نداده است.

از زمان عرضه ChatGPT توسط OpenAI در نوامبر 2022، بازار هوش مصنوعی مولد رونق گرفته است و تقاضا برای GPUهای مورد استفاده برای آموزش و استنتاج بر روی مدل‌های زبانی بزرگ بیشتر از قبل شده است. اینتل و ای‌ام‌دی در تلاش هستند با انویدیا، که حدود 90 درصد سهم بازار GPU را در اختیار دارد، رقابت کنند. این موضوع چالش‌هایی را برای اینتل ایجاد کرده است: اول، تایید عملکرد Gaudi توسط یک مشتری بزرگ و دوم، تامین کافی این تراشه‌ها از TSMC، کارخانه ریخته‌گری تراشه مستقر در تایوان که در تولید GPU پیشرو است.

همکاری اینتل و آی‌بی‌ام در زمینه هوش مصنوعی

اینتل علاوه بر معرفی Gaudi 3، از همکاری با آی‌بی‌ام برای راه‌اندازی کارت گرافیک روی سرویس ابری IBM Cloud، به ویژه روی پلتفرم هوش مصنوعی مولد و Watsonx، خبر داد. هدف این همکاری مشترک، کاهش هزینه کل مالکیت برای استفاده و گسترش هوش مصنوعی عنوان شده است.

تمرکز آی‌بی‌ام بر استنتاج

روهیت بادلانی (Rohit Badlaney)، مدیر کل پلتفرم‌های محصولات و صنایع ابری آی‌بی‌ام، هفته گذشته در رویداد اینتل اعلام کرد: «در حال حاضر، تمرکز ما روی استنتاج (استفاده از مدل‌های هوش مصنوعی آموزش‌دیده) است. بنابراین ما به شدت روی موارد استفاده استنتاج با در نظر گرفتن هزینه، عملکرد، امنیت و انطباق با قوانین تمرکز کرده‌ایم. این حوزه‌ای است که ما عملکرد خوبی داریم. آی‌بی‌ام، شتاب‌دهنده Gaudi 3 را با پردازنده‌های گرافیکی انودیا و ای‌ام‌دی مقایسه کرده و متوجه شده است که عملکرد به ازای هزینه آن در مقایسه با رقبا بهتر است».

بادلانی ادامه داد: «ما تمام شتاب‌دهنده‌ها را آزمایش کرده‌ایم، اما در عین حال با انودیا و ای‌ام‌دی کارهای گسترده‌ای انجام می‌دهیم و از به‌کارگیری Gaudi 3 هیجان‌زده هستیم. ما آن را روی Llama، مدل هوش مصنوعی Mistral، مدل‌های Granite خودمان آزمایش کرده‌ایم و متوجه شدیم شتاب‌دهنده جدید اینتل برای مدل‌های Granite ما تفاوت ایجاد می‌کند، به همین دلیل هیجان‌زده هستیم. ما قصد به‌کارگیری Gaudi را داریم و به همکاری مشترک با اینتل در زمینه توسعه‌ی نوآوری ادامه دهیم».

اینتل نظرات مثبت شرکت‌های arcee.ai، AsteraLabs و Dell Technologies در مورد شتاب‌دهنده Gaudi را دریافت کرده و به اشتراک گذاشته است که نشان می‌دهد، شرکت‌های بزرگ و فعال در حوزه تولید سرور و هوش مصنوعی، عملکرد این محصول جدید را تایید کرده‌اند.

بازاری باز برای هوش مصنوعی

جاستین هوتارد، معاون اجرایی ارشد اینتل و مدیر کل گروه مراکز داده و هوش مصنوعی، در این ارتباط گفته است: «تقاضا برای هوش مصنوعی منجر به تحولی عظیم در مراکز داده شده است و انتظار می‌رود در سال‌های آتی مراکز داده با بارهای محاسباتی سنگینی از سمت هوش مصنوعی روبرو شوند. از‌این‌رو، صنعت خواستار سخت‌افزار، نرم‌افزار و ابزارهای توسعه قدرتمندی است که جوابگوی نیازهای سطح بالا باشد. با عرضه پردازنده قدرتمند Xeon 6 با هسته‌های عملکردی و شتاب‌دهنده‌ هوش مصنوعی Gaudi 3، اینتل در حال ایجاد یک اکوسیستم باز است که به مشتریان امکان می‌دهد تمام کارهای خود را با عملکرد، بازده و امنیت بالاتر اجرا کنند».

همکاری اینتل با سازندگان رایانه

در مورد پردازنده‌های زئون، اینتل بر این نکته تایید دارد که این پردازنده‌ها همراه با GPU‌هایی که کارهای هوش مصنوعی را انجام می‌دهند، یک توان محاسباتی سطح بالا در اختیار شرکت‌ها قرار می‌دهند تا بتوانند روند آموزش مدل‌های زبانی بزرگ را در زمان کوتاه‌تری به سرانجام برسانند. اینتل می‌گوید: «73 درصد سرورهای مجهز به کارت گرافیک از پردازنده‌های زئون به عنوان منبع اصلی محاسبات استفاده می‌کنند». اینتل با شرکت‌های سازنده رایانه مانند Dell Technologies، HPE، Lenovo و Supermicro برای توسعه سیستم‌های طراحی‌شده مشترک برای استقرار هوش مصنوعی همکاری می‌کند. همچنین، با شرکت دل در حال طراحی راه‌حل‌های مبتنی بر بازیابی و تولید تقویت‌شده (RAG) با استفاده از Gaudi 3 و Xeon 6 است.

چالش‌های انتقال هوش مصنوعی از نمونه اولیه به تولید

اینتل می‌گوید: «انتقال راهکارهای هوش مصنوعی مولد از نمونه‌های اولیه به سیستم‌های آماده‌ی تولید، چالش‌هایی را در زمینه نظارت بلادرنگ، رسیدگی به خطاها، ثبت وقایع، امنیت و مقیاس‌پذیری ایجاد می‌کند. اینتل از طریق تلاش‌های مشترک با تولیدکنندگان تجهیزات اصلی (OEM) و شرکای خود برای ارائه راهکارهای RAG، آماده‌ غلبه بر این چالش‌ها است».

استفاده از پلتفرم OPEA

این راهکارها، که بر اساس پلتفرم هوش مصنوعی سازمانی منبع باز (OPEA) ساخته شده‌اند، میکروسرویس‌های مبتنی بر OPEA را در یک سیستم RAG مقیاس‌پذیر، بهینه‌سازی شده برای سیستم‌های Xeon و Gaudi، ادغام می‌کنند. این طراحی به مشتریان اجازه می‌دهد تا برنامه‌های کاربردی از Kubernetes، Red Hat OpenShift AI و Red Hat Enterprise Linux AI را یکپارچه کنند.

پورتفولیوی Tiber Developer Cloud

اینتل گفته است: «پورتفولیوی Tiber Developer Cloud، راهکارهای تجاری برای مدیریت دسترسی، هزینه، پیچیدگی، امنیت، کارایی و مقیاس‌پذیری در محیط‌های هوش مصنوعی، ابری و لبه‌ای ارائه می‌دهد. Tiber سیستم‌های پیش‌نمایش Xeon 6 را برای ارزیابی و آزمایش فناوری ارائه می‌دهد. علاوه بر این، برخی مشتریان به صورت اولیه به Gaudi 3 دسترسی خواهند داشت تا استقرار مدل‌های هوش مصنوعی خود را اعتبارسنجی کنند. خوشه‌های Gaudi 3 نیز در سه ماهه آینده برای آموزش و استقرارهای مدل‌های زبانی عرضه خواهند شد.

خدمات جدید

خدمات جدید شامل SeekrFlow، یک پلتفرم جامع هوش مصنوعی از Seekr برای توسعه برنامه‌های هوش مصنوعی قابل اعتماد است. به‌روزرسانی‌ها شامل جدیدترین نسخه نرم‌افزار Gaudi  و Notbook Jupyter همراه با ابزارهای PyTorch 2.4 و Intel oneAPI و AI Intel 2024.2 است که شامل قابلیت‌های جدید شتاب‌دهنده هوش مصنوعی و پشتیبانی از پردازنده‌های Xeon 6 می‌شود.

 

اشتراک‌گذاری:
برای ثبت نام در خبرنامه، عضو شوید.
مطالب مشابه
برای دریافت مشاوره و یا اطلاع از قیمت، با ما در تماس باشید.