بررسی تخصصی سوئیچ Marvell Teralynx 10 با 64 پورت 800 گیگابیت بر ثانیه و ظرفیت 51.2 ترابیت بر ثانیه

فهرست مطالب

در این مقاله قصد داریم نگاهی به داخل یک سوئیچ غول‌پیکر با 64 پورت 800 گیگابیت بر ثانیه داشته باشیم. Marvell Teralynx 10 یک سوئیچ 51.2 ترابیت بر ثانیه است که نسل بعدی سوئیچ‌هایی است که در خوشه‌های هوش مصنوعی در سال 2025 شاهد آن‌ها خواهیم بود. این محصول یک سوئیچ شبکه‌ی بزرگ، کلاس سازمانی و البته گران‌قیمت است که قصد داریم در این مقاله به تفصیل در مورد آن صحبت کنیم.

پیش زمینه Marvell Teralynx

اجازه دهید نگاهی کوتاه به چگونگی رسیدن به این نقطه داشته باشیم. شرکت Marvell در سال 2021 شرکت Innovium را خریداری کرد. این اتفاق پس از رونمایی از سوئیچ 32 پورت 400 گیگابیت بر ثانیه Innovium Teralynx 7 رخ داد، جایی که ما نسل 12.8 ترابیت بر ثانیه (32 پورت 400 گیگابیت بر ثانیه) این شرکت نوپا را شاهد بودیم.

شرکت اینوویوم موفق‌ترین استارت‌آپ نسل خود بوده که توانسته است با محصولات موفقی به مراکز داده‌ی ابرمقیاس (Hyper-Scale) نفوذ کند. برای مثال، در سال ۲۰۱۹ شرکت اینتل اعلام کرد که قصد خرید شرکت Barefoot Networks را برای دستیابی به فناوری سیلیکون سوئیچ اترنت دارد. اما در گزارش درآمدی سه‌ماهه‌ی چهارم ۲۰۲۲ اینتل، این شرکت اعلام کرد که واحد تجارت سوئیچ‌های اترنت خود را واگذار خواهد کرد. در حالی که برودکام غولِ تجارت تراشه‌های سوئیچ‌های مستقل به شمار می‌رود، اینوویوم (که حالا زیرمجموعه‌ی مارول شده) توانسته است به مراکز داده‌ی ابرمقیاس نفوذ کند؛ بازاری که بسیاری از شرکت‌ها با صرف هزینه‌های هنگفت، در آن شکست خورده‌اند. جالب آن‌که سوییچ‌های طراحی شده توسط این شرکت گزینه مناسبی برای استقرار در مراکز داده هستند.

با توجه به حجم عظیم خوشه‌های هوش مصنوعی در حال ساخت، نسل تراشه‌های سوئیچ 51.2 ترابیت بر ثانیه اهمیت ویژه‌ای پیدا خواهند کرد. به همین دلیل، مهم است اطلاعات دقیقی در ارتباط با نسل جدید سوییچ‌هایی که برای این منظور به بازار عرضه خواهند شد، اطلاعاتی به دست آوریم.

بررسی نمای خارجی سوئیچ Marvell Teralynx 10 و اپتیک‌های OSFP

با نگاهی به جلوی سوئیچ، یک شاسی 2U را مشاهده می‌کنیم که بیشتر بخش‌های آن‌را کیج‌های OSFP و کانال‌های جریان هوا تشکیل می‌دهند.

در مجموع 64 پورت OSFP وجود دارند که دستیابی به سرعت 800 گیگابیت بر ثانیه را تضمین می‌کنند.

داخل هر یک از این پورت‌ها، ماژول‌های اپتیک قابل تعویض OSFP قرار می‌گیرند. این ماژول‌ها کمی بزرگ‌تر از نسل‌های رایج‌تر QSFP+ / QSFP28 هستند.

مارول تعدادی از این ماژول‌های اپتیک را نیز همراه سوئیچ ارائه می‌دهد، زیرا پس از خرید شرکت Inphi، بسیاری از مولفه‌های تشکیل‌دهنده‌ی این ماژول‌های اپتیک را نیز در اختیار گرفته است. بنابراین، مشکلی از بابت تهیه ماژول‌های اپتیک قابل نصب روی این سوییچ وجود نخواهد داشت. نکته‌ی دیگر این است که پورت‌های این سوئیچ می‌توانند با سرعت‌های دیگری به غیر از 800 گیگابیت بر ثانیه نیز کار کنند.

يکي از نکات جالب توجهي که ديديم، تعدادي از ماژول‌هاي اپتيکي برد بلند است. اين ماژول‌ها مي‌توانند سرعت ۸۰۰ گيگابيت بر ثانيه را تا صدها کيلومتر يا حتي بيش‌تر، بدون افت کيفيت، تضمین کنند. اين ماژول‌ها به اين دليل جالب هستند که درون محفظه‌های OSFP قرار می‌گیرند و ديگر نيازي به استفاده از محفظه‌های اپتيکي بزرگ و طولانی که براي سال‌ها در اين صنعت به کار مي‌رفت، نيست.

یکی از مزایای استفاده از ماژول‌های OSFP در این سوئیچ، تاثیر آن روی هیت‌سینک‌ها است. از آنجایی که ماژول‌های OSFP می‌توانند هیت‌سینک‌های مجزای خود را داشته باشند، دیگر نیازی به وجود هیت‌سینک روی کیج‌های سوئیچ نیست. برعکس، در سوئیچ‌های 100 و 400 گیگابیت بر ثانیه‌ای که ما کالبدشکافی کرده‌ایم، به دلیل مصرف برق بالای ماژول‌ها، محفظه‌های اپتیکی، خودشان نیاز به هیت‌سینک داشتند.

در سمت راست سوییچ، چهار پورت کنسول و مدیریت قرار گرفته‌اند.

در پشت سوییچ نیز فن‌ها و منابع تغذیه قرار دارند که وظیفه دفع حرارت و تامین برق قطعات سوییچ را بر عهده دارند.

با توجه به اینکه سوئیچ می‌تواند از ماژول‌های اپتیکی با توانی در حدود ۱.۸ کیلووات استفاده کند، و همچنین دارای یک تراشه سوئیچ با توان ۵۰۰ وات است، می‌توان انتظار داشت که به منبع تغذیه‌ای با توانی بیش از ۲ کیلووات نیاز داشته باشد. اکنون، اجازه دهید به داخل سوییچ نگاهی داشته باشیم.  ما از کیج‌های OSFP (سمت راست) شروع می‌کنیم و به سمت منبع تغذیه و فن‌ها (سمت چپ) حرکت می‌کنیم.

هنگامی که سوییچ را باز می‌کنیم، اولین چیزی که به چشم می‌آید، هیت‌سینک‌های بزرگ قرار گرفته در آن هستند.

تراشه‌ی این سوئیچ از نوع 5 نانومتری بوده و توان مصرفی آن 500 وات است.

هنگامی که هیت‌سینک برداشته می‌شود، می‌توانیم نگاهی دقیق به کیج‌های OSFP بدون پوشش هیت‌سینک داشته باشیم. همانطور که در تصویر می‌بینید، تنها 32 عدد کیج OSFP وجود دارد. دلیل این امر قرارگیری برد مدار چاپی (PCB) سوئیچ در وسط این دو بلوک است.

پشت کیج‌های OSFP، تراشه‌ی Teralynx 10 قرار دارد. مطمئن هستیم علاقمندان می‌توانند در فرصتی مناسب اطلاعات بیشتری در مورد تراشه‌ی Teralynx 10 کسب کنند. اما در اینجا، دیاگرام عملکرد اولیه‌ی این تراشه را که قبلا نیز نمایش داده‌ایم، مشاهده می‌کنید.

نگاهی دقیق‌تر به تراشه‌ی بدون پوشش سوئیچ

یکی از نکات قابل توجه در مورد این سوئیچ، زاویه‌دار بودن بسیاری از قطعات آن است که برخلاف روال معمول است که مولفه‌ها به صورت افقی یا موازی با لبه‌های تراشه‌ی سوئیچ قرار گرفته‌اند.

در تصویر بالا، نمای بالایی تراشه‌ی سوئیچ 64 پورت 800 گیگابیت بر ثانیه را مشاهده می‌کنید. اگر با دنیای سرور آشنایی داشته باشید، به خوبی از این نکته اطلاع دارید که ما در دوران PCIe نسل ششم هستیم و می‌توانیم کارت شبکه (NIC) تک پورت 800 گیگابیت بر ثانیه را مورد استفاده قرار دهیم. البته، در حال حاضر کارت‌های شبکه PCIe نسل پنجم x16 از نوع 400 گیگابیت بر ثانیه مورد استفاده شرکت‌ها قرار دارد، اما این تراشه به تنهایی ظرفیت مدیریت 128 عدد از سریع‌ترین کارت‌های شبکه‌ PCIe نسل پنجم 400 گیگابیت بر ثانیه را دارد. همانند بسیاری از سوئیچ‌ها، Teralynx 10 نیز دارای یک کنترلر مدیریت اختصاصی است. نکته‌ی جالب توجه این است که این یک برد مدیریت مبتنی بر Marvell Octeon است. همچنین، یک درایو حالت جامد M.2 روی برد اصلی سوئیچ قرار گرفته است.

یکی از ویژگی‌های جالب این سوئیچ، اسلات داخلی PCIe برای کارهای تشخیصی است. با کمی دقت، می‌توانید یک درگاه داخلی 10 گیگابیت اترنت را که به عنوان رابط مدیریت در نظر گرفته شده است، مشاهده کنید. نکته‌ی قابل توجه دیگر، ضخامت بالای برد مدار چاپی (PCB) سوئیچ است. تصور کنید اگر مادربورد سرور به این ضخامت بود، بسیاری از طراحی‌های سرور 1U با چالش‌های جدی سرمایشی روبرو می‌شدند. در مورد خنک‌کننده، با یک سیستم فن نسبتا ساده با چهار ماژول فن در پشت شاسی روبرو هستیم.

ایجاد ترافیک 800 گیگابیت بر ثانیه روی یک پورت در حال حاضر کار ساده‌ای نیست، چون این سرعت از استاندارد PCIe نسل پنجم x16 در سرورها هم سریع‌تر است. با این حال، مشاهده عملکرد این تجهیزات در آزمایشگاه جالب است. اینجا یک نمونه‌ی دو کاناله‌ی 400 گیگابیت بر ثانیه را می‌بینیم که با نرخ خط تقریباً ۹۹.۳ درصد روی سوئیچ‌های Teralynx 10 اجرا می‌شود.

چرا سوئیچ‌های ۵۱.۲ ترابیت بر ثانیه؟

دو نیروی محرک باعث ورود سوئیچ‌های ۵۱.۲ ترابیت بر ثانیه به بازار شده‌اند. نیروی اول، موضوع مورد علاقه‌ی همگان، هوش مصنوعی (AI) است. نیروی دوم نیز به ملاحظات مربوط به مصرف برق و «راديکس» یا همان تعداد اتصالات مستقیم یک گره به گره‌های دیگر در یک شبکه ارتباط دارد. با توجه به این‌که تقریبا همه شرکت‌های بزرگ دنیای فناوری و به ویژه تولیدکنندگان محصولات سخت‌افزاری، هم‌راستا با تحولات روز در حال توسعه تجهیزاتی هستند که توانایی پاسخ‌گویی به نیازهای شرکت‌ها در ارتباط با هوش مصنوعی را داشته باشد، از این‌رو، جای تعجب نیست که شرکت‌های فعال در زمینه ساخت سوییچ‌ها نیز به دنبال طراحی محصولاتی باشند که توانایی مدیریت ترافیک و پهنای باند بسیار بالای شبکه‌های محلی را داشته باشد.

شرکت مارول، سوئیچ‌های Teralynx 10 را با تاخیری حدود ۵۰۰ نانوثانیه و همزمان با پهنای باند عظیم به بازار عرضه می‌کند. این تأخیر قابل پیش‌بینی، به همراه کنترل ازدحام، قابلیت برنامه‌ریزی و اندازه‌گیری اطلاعات از تراشه‌ی سوئیچ، به عملکرد بهینه و مداوم خوشه‌های بزرگ کمک می‌کند. این موضوع عجیب نیست، زیرا بی‌کار ماندن پردازنده‌های هوش مصنوعی به دلیل تأخیر شبکه، بسیار پرهزینه است و این مسئله در مراکز داده باعث افزایش غیرقابل تصور هزینه‌های جانبی می‌شود.

مورد بعدی، راديکس (radix) است. استفاده از سوئیچ‌های بزرگ‌تر می‌تواند تعداد لایه‌های سوئیچینگ را کاهش دهد. این امر به نوبه‌ی خود، تعداد سوئیچ‌ها، ماژول‌های اپتیک، کابل‌ها و غیره را که برای اتصال یک خوشه لازم است، کاهش می‌دهد. با توجه به اینکه Teralynx 10 می‌تواند از راديکس ۵۱۲ با اتصال از طریق حداکثر ۵۱۲ لینک ۱۰۰ گیگابیت بر ثانیه پشتیبانی کند، برخی از شبکه‌ها می‌توانند نیاز به سه سطح سوئیچینگ را به تنها دو سطح کاهش دهند. در مقیاس یک خوشه‌ی آموزش هوش مصنوعی نسبتا بزرگ، این صرفه‌جویی نه تنها در هزینه‌ی تجهیزات، بلکه در مصرف برق نیز قابل توجه است. شرکت مارول به وضوح به این نکته اشاره دارد که راديکس بالاتر، منجر به صرفه‌جویی در مصرف برق بیش از ۱ مگا وات می‌شود.

کلام آخر

محصولی که در این مطلب مورد بررسی قرار دادیم، به وضوح نشان می‌دهد در آستانه عرضه طیف گسترده‌ای از محصولات سخت‌افزاری هستیم که قابل مقایسه با محصولات عرضه شده در چند سال گذشته نیستند. ما اغلب در تصاویر و مراکز داده، نمای جلوی سوئیچ‌ها و شاید نمای پشت آن‌ها را می‌بینیم. اما به ندرت می‌بینیم چه چیزی باعث کارکرد این سوئیچ‌ها می‌شود. از شرکت مارول به خاطر این‌که اجازه داد نه تنها سوئیچ‌های در حال کار را مشاهده کنیم، بلکه آن‌ها را تا سطح سیلیکون مورد بررسی قرار دهیم، بسیار سپاسگزاریم.

تیم Innovium، که اکنون زیرمجموعه‌ی مارول است، یکی از معدود تیم‌های فعال در حوزه صنعت، یا شاید تنها تیم، بوده است که توانسته به طور مستقیم با Broadcom رقابت کند و در بخش محاسبات فراهمگرا و مراکز داده فرامقیاس به موفقیت‌های بزرگی دست پیدا کند. ما شاهد شکست غول‌های دیگر عرضه‌کننده‌ی سیلیکون در این رقابت بوده‌ایم، اما با توجه به تقاضای بازار برای راديکس بالا، پهنای باند بالا و تاخیر کم در سوئیچینگ خوشه‌های هوش مصنوعی، به احتمال زیاد Teralynx 10 به بزرگ‌ترین خط تولید این شرکت از زمان Teralynx 7 تبدیل خواهد شد.

امیدواریم خوانندگان از این مقاله لذت برده باشند. بدیهی است که در دنیای شبکه، موضوعات مختلف دیگری نیز وجود دارد. ما می‌توانیم در مورد ماژول‌های اپتیک، و حتی نرم‌افزار، عملکرد و موارد دیگر، مقالات کاملی بنویسیم. با این حال، دیدن اینکه درون این سوئیچ‌ها چه می‌گذرد، جالب است. اگر به دنبال سوئیچ‌های ۵۱.۲ ترابیت بر ثانیه هستید، به سادگی از کنار Teralynx 10 عبور نکنید.

اشتراک‌گذاری
مطالب مشابه
برای دریافت مشاوره و یا اطلاع از قیمت، با ما در تماس باشید.