پردازندههای Xeon 6 و Gaudi 3
در حالی که اخبار مختلفی در مورد پیشنهاد سرمایهگذاری چند میلیارد دلاری از سوی کوالکام منتشر شده و همچنین خبرهایی مبنی بر خرید اینتل مورد توجه رسانهها قرار گرفته است، اما این شرکت به طور رسمی از پردازندههای Gaudi 3 و Xeon 6 رونمایی کرد. هر دو این تراشهها برای پاسخگویی به تقاضای رو به رشد محاسبات هوش مصنوعی و رقابت با شرکتهایی مانند انویدیا و ایامدی طراحی شدهاند.
اینتل اعلام کرده است که پردازنده Xeon 6 تحت عنوان Granite Rapids با هستههای عملکردی (P-cores) دو برابر عملکرد بهتری نسب به نسل قبلی دارند. این در حالی است که تعداد هستهها افزایشیافته، پهنای باند حافظه دوبرابر شده و قابلیتهای شتابدهنده هوش مصنوعی نیز در خود هستهها قرار گرفتهاند.
در سویی دیگر، شتابدهنده هوش مصنوعی Gaudi 3 را داریم که برای هوش مصنوعی مولد طراحی و مجهز به 64 هسته پردازشی تانسور (TPCs) و هشت موتور ضرب ماتریسی (MMEs) برای انجام محاسبات شبکههای عصبی عمیق است. این پردازنده، به طور اختصاصی برای اپراتورهای مخابراتی، شرکتهای بزرگ فعال در زمینه ساخت مدلهای هوشمند و مراکز داده بزرگی که روزانه به میلیونها تراکنش پاسخ میدهند در نظر گرفته شده است.
در شرایطی که اینتل در حوزه ساخت تراشهها، رقابت شدیدی با انویدیا و ایامدی دارد، اما در حوزههای دیگر با چالشهای جدی روبرو است. گزارشها حاکی از آن است که شرکت سرمایهگذاری Apollo Global Management پیشنهاد سرمایهگذاری 5 میلیارد دلاری به اینتل داده که باعث افزایش ارزش سهام این شرکت شده است. در عین حال، هفته گذشته گزارش شد که غول تراشههای تلفن همراه، کوالکام، با پیشنهاد خرید به اینتل نزدیک شده است. پیشنهاد آپولو توسط برخی به عنوان یک انتخاب راهبردی از سوی پت گلسینگر، که اوایل سال 2021 مسئولیت این شرکت را بر عهده گرفت، و همچنین به عنوان پاسخی احتمالی به پیشنهاد کوالکام دیده میشود.
Gaudi 3 دارای 128 گیگابایت حافظه HBM2e برای آموزش و استنتاج و 24 پورت اترنت 200 گیگابیت برای شبکهسازی مقیاسپذیر است. همچنین، اینتل اعلام کرد که Gaudi 3 با فریمورک برنامهنویسی PyTorch و مدلهای ترانسفورمر و دیفیوزر Hugging Face سازگار است.
اینتل ادعا میکند که GPU جدیدش نسبت به GPU H100 انویدیا، از نظر هزینه/عملکرد مقرون به صرفهتر است. به عنوان مثال، اینتل میگوید که Gaudi 3 در مدل زبانی بزرگ LLaMA 3 8B متا، 1.09 برابر توان عملیاتی استنتاج و 1.8 برابر عملکرد بهتر به ازای هر دلار ارائه میدهد. با این حال، اینتل دادههای مقایسهای بین Gaudi 3 و Blackwell، تراشه برتر GPU انویدیا که قرار است در نیمه اول سال آینده عرضه شود را ارائه نداده است.
از زمان عرضه ChatGPT توسط OpenAI در نوامبر 2022، بازار هوش مصنوعی مولد رونق گرفته است و تقاضا برای GPUهای مورد استفاده برای آموزش و استنتاج بر روی مدلهای زبانی بزرگ بیشتر از قبل شده است. اینتل و ایامدی در تلاش هستند با انویدیا، که حدود 90 درصد سهم بازار GPU را در اختیار دارد، رقابت کنند. این موضوع چالشهایی را برای اینتل ایجاد کرده است: اول، تایید عملکرد Gaudi توسط یک مشتری بزرگ و دوم، تامین کافی این تراشهها از TSMC، کارخانه ریختهگری تراشه مستقر در تایوان که در تولید GPU پیشرو است.
همکاری اینتل و آیبیام در زمینه هوش مصنوعی
اینتل علاوه بر معرفی Gaudi 3، از همکاری با آیبیام برای راهاندازی کارت گرافیک روی سرویس ابری IBM Cloud، به ویژه روی پلتفرم هوش مصنوعی مولد و Watsonx، خبر داد. هدف این همکاری مشترک، کاهش هزینه کل مالکیت برای استفاده و گسترش هوش مصنوعی عنوان شده است.
تمرکز آیبیام بر استنتاج
روهیت بادلانی (Rohit Badlaney)، مدیر کل پلتفرمهای محصولات و صنایع ابری آیبیام، هفته گذشته در رویداد اینتل اعلام کرد: «در حال حاضر، تمرکز ما روی استنتاج (استفاده از مدلهای هوش مصنوعی آموزشدیده) است. بنابراین ما به شدت روی موارد استفاده استنتاج با در نظر گرفتن هزینه، عملکرد، امنیت و انطباق با قوانین تمرکز کردهایم. این حوزهای است که ما عملکرد خوبی داریم. آیبیام، شتابدهنده Gaudi 3 را با پردازندههای گرافیکی انودیا و ایامدی مقایسه کرده و متوجه شده است که عملکرد به ازای هزینه آن در مقایسه با رقبا بهتر است».
بادلانی ادامه داد: «ما تمام شتابدهندهها را آزمایش کردهایم، اما در عین حال با انودیا و ایامدی کارهای گستردهای انجام میدهیم و از بهکارگیری Gaudi 3 هیجانزده هستیم. ما آن را روی Llama، مدل هوش مصنوعی Mistral، مدلهای Granite خودمان آزمایش کردهایم و متوجه شدیم شتابدهنده جدید اینتل برای مدلهای Granite ما تفاوت ایجاد میکند، به همین دلیل هیجانزده هستیم. ما قصد بهکارگیری Gaudi را داریم و به همکاری مشترک با اینتل در زمینه توسعهی نوآوری ادامه دهیم».
اینتل نظرات مثبت شرکتهای arcee.ai، AsteraLabs و Dell Technologies در مورد شتابدهنده Gaudi را دریافت کرده و به اشتراک گذاشته است که نشان میدهد، شرکتهای بزرگ و فعال در حوزه تولید سرور و هوش مصنوعی، عملکرد این محصول جدید را تایید کردهاند.
بازاری باز برای هوش مصنوعی
جاستین هوتارد، معاون اجرایی ارشد اینتل و مدیر کل گروه مراکز داده و هوش مصنوعی، در این ارتباط گفته است: «تقاضا برای هوش مصنوعی منجر به تحولی عظیم در مراکز داده شده است و انتظار میرود در سالهای آتی مراکز داده با بارهای محاسباتی سنگینی از سمت هوش مصنوعی روبرو شوند. ازاینرو، صنعت خواستار سختافزار، نرمافزار و ابزارهای توسعه قدرتمندی است که جوابگوی نیازهای سطح بالا باشد. با عرضه پردازنده قدرتمند Xeon 6 با هستههای عملکردی و شتابدهنده هوش مصنوعی Gaudi 3، اینتل در حال ایجاد یک اکوسیستم باز است که به مشتریان امکان میدهد تمام کارهای خود را با عملکرد، بازده و امنیت بالاتر اجرا کنند».
همکاری اینتل با سازندگان رایانه
در مورد پردازندههای زئون، اینتل بر این نکته تایید دارد که این پردازندهها همراه با GPUهایی که کارهای هوش مصنوعی را انجام میدهند، یک توان محاسباتی سطح بالا در اختیار شرکتها قرار میدهند تا بتوانند روند آموزش مدلهای زبانی بزرگ را در زمان کوتاهتری به سرانجام برسانند. اینتل میگوید: «73 درصد سرورهای مجهز به کارت گرافیک از پردازندههای زئون به عنوان منبع اصلی محاسبات استفاده میکنند». اینتل با شرکتهای سازنده رایانه مانند Dell Technologies، HPE، Lenovo و Supermicro برای توسعه سیستمهای طراحیشده مشترک برای استقرار هوش مصنوعی همکاری میکند. همچنین، با شرکت دل در حال طراحی راهحلهای مبتنی بر بازیابی و تولید تقویتشده (RAG) با استفاده از Gaudi 3 و Xeon 6 است.
چالشهای انتقال هوش مصنوعی از نمونه اولیه به تولید
اینتل میگوید: «انتقال راهکارهای هوش مصنوعی مولد از نمونههای اولیه به سیستمهای آمادهی تولید، چالشهایی را در زمینه نظارت بلادرنگ، رسیدگی به خطاها، ثبت وقایع، امنیت و مقیاسپذیری ایجاد میکند. اینتل از طریق تلاشهای مشترک با تولیدکنندگان تجهیزات اصلی (OEM) و شرکای خود برای ارائه راهکارهای RAG، آماده غلبه بر این چالشها است».
استفاده از پلتفرم OPEA
این راهکارها، که بر اساس پلتفرم هوش مصنوعی سازمانی منبع باز (OPEA) ساخته شدهاند، میکروسرویسهای مبتنی بر OPEA را در یک سیستم RAG مقیاسپذیر، بهینهسازی شده برای سیستمهای Xeon و Gaudi، ادغام میکنند. این طراحی به مشتریان اجازه میدهد تا برنامههای کاربردی از Kubernetes، Red Hat OpenShift AI و Red Hat Enterprise Linux AI را یکپارچه کنند.
پورتفولیوی Tiber Developer Cloud
اینتل گفته است: «پورتفولیوی Tiber Developer Cloud، راهکارهای تجاری برای مدیریت دسترسی، هزینه، پیچیدگی، امنیت، کارایی و مقیاسپذیری در محیطهای هوش مصنوعی، ابری و لبهای ارائه میدهد. Tiber سیستمهای پیشنمایش Xeon 6 را برای ارزیابی و آزمایش فناوری ارائه میدهد. علاوه بر این، برخی مشتریان به صورت اولیه به Gaudi 3 دسترسی خواهند داشت تا استقرار مدلهای هوش مصنوعی خود را اعتبارسنجی کنند. خوشههای Gaudi 3 نیز در سه ماهه آینده برای آموزش و استقرارهای مدلهای زبانی عرضه خواهند شد.
خدمات جدید
خدمات جدید شامل SeekrFlow، یک پلتفرم جامع هوش مصنوعی از Seekr برای توسعه برنامههای هوش مصنوعی قابل اعتماد است. بهروزرسانیها شامل جدیدترین نسخه نرمافزار Gaudi و Notbook Jupyter همراه با ابزارهای PyTorch 2.4 و Intel oneAPI و AI Intel 2024.2 است که شامل قابلیتهای جدید شتابدهنده هوش مصنوعی و پشتیبانی از پردازندههای Xeon 6 میشود.