کنترل غیرمتمرکز مرکز داده با استفاده از رایانش لبه

فهرست مطالب

کنترل غیرمتمرکز مرکز داده با بهره‌گیری از رایانش لبه (Edge Computing)، پارادایم مدیریت زیرساخت را از یک هسته‌ مرکزی سنگین به سمت شبکه‌ای از گره‌های هوشمند و توزیع‌شده سوق می‌دهد که در آن تصمیم‌گیری‌ها در نزدیک‌ترین فاصله به منبع تولید داده (سنسورها و تجهیزات) انجام می‌شود. در این رویکرد، به جای ارسال تمامی داده‌های مانیتورینگ محیطی، توان و امنیت به یک سرور مرکزی که منجر به ایجاد گلوگاه و تاخیر در پاسخگویی می‌شود، هر بخش از مرکز داده یا هر ردیف از رک‌ها مجهز به Edge Gateways می‌شوند که توان پردازش محلی دارند.

این پردازنده‌های لبه‌ قادر هستند با استفاده از الگوریتم‌های پایش لحظه‌ای، نوسانات بحرانی مانند نشت آب در زیر کف کاذب، افزایش ناگهانی دما یا اختلال در جریان برق را در کسری از ثانیه شناسایی کرده و بلافاصله واکنش‌های اصلاحی (مانند تغییر دور فن‌ها یا قطع مدار) را بدون منتظر ماندن برای تایید از سرور مرکزی اجرا کنند. این ساختار غیرمتمرکز نه تنها باعث کاهش چشمگیر ترافیک شبکه مدیریت و پهنای باند مصرفی می‌شود، بلکه پایداری سیستم را نیز تضمین می‌کند؛ زیرا در صورت قطع ارتباط با مرکز یا خرابی نرم‌افزار مانیتورینگ اصلی، هر گره لبه به صورت مستقل و خودمختار (Autonomous) به وظایف حفاظتی خود ادامه می‌دهد. در واقع، رایانش لبه با حذف وابستگی مطلق به مرکزیت، مفهوم “اطمینان‌پذیری توزیع‌شده” را محقق می‌سازد که در آن هوش مصنوعی مستقر در لبه، با تحلیل الگوهای مصرف انرژی و الگوهای حرارتی هر رک، بهینه‌سازی منابع را به صورت محلی انجام داده و تنها نتایج نهایی و گزارش‌های دوره‌ای را برای سیستم‌های مدیریتی بالادستی مانند DCIM ارسال می‌کند.

نقش پروتکل‌های ارتباطی مدرن در انتقال داده‌های لبه به مرکز داده

پروتکل MQTT سرنام (Message Queuing Telemetry Transport) به عنوان ستون فقرات ارتباطی در معماری رایانش لبه، نقشی حیاتی در انتقال بهینه و بلادرنگ داده‌های سنسورها از لایه‌ی عملیاتی به مرکز مانیتورینگ ایفا می‌کند. این پروتکل که بر پایه مدل Publish/Subscribe طراحی شده است، بر خلاف پروتکل‌های قدیمی‌تر مانند HTTP که متکی بر درخواست‌های مداوم و سنگین هستند، تنها زمانی داده را ارسال می‌کند که تغییری در وضعیت سنسور (مانند نشت آب یا نوسان دما) رخ داده باشد؛ این ویژگی باعث کاهش چشمگیر مصرف پهنای باند و بار پردازشی در گره‌های لبه می‌شود.

در دیتاسنترهای مدرن، سنسورها و گیت‌وی‌های مستقر در لبه، داده‌های خود را با حجم بسیار کم (تنها چند بایت) به یک کارگزار مرکزی به نام بروکر ارسال می‌کنند. بروکِر وظیفه دارد این اطلاعات را با سرعت بسیار بالا به نرم‌افزارهای مانیتورینگ که روی موضوعات خاص اشتراک دارند، تحویل دهد. از آنجایی که MQTT به گونه‌ای طراحی شده که در شبکه‌های ناپایدار و با تاخیر بالا نیز به خوبی عمل کند، ویژگی‌هایی مانند QoS تضمین می‌کنند حتی در صورت قطعی موقت شبکه، پیام‌های حیاتی مربوط به نشت آب یا حریق حتما به دست سیستم مرکزی برسند. همچنین، قابلیت Last Will and Testament در این پروتکل به سیستم مرکزی اجازه می‌دهد به محض قطع شدن ارتباط یک گره لبه، بلافاصله از خرابی آن مطلع شود. در واقع، MQTT با فراهم کردن یک زبان مشترک، سبک و ایمن، امکان یکپارچه‌سازی هزاران سنسور پراکنده در سطح دیتاسنتر را فراهم کرده و بستری ایده‌آل برای تحلیل‌های پیش‌دستانه و مدیریت هوشمند زیرساخت در مقیاس بزرگ ایجاد می‌کند.

روش پیاده‌سازی بروکر داخلی (مانند Mosquitto) برای تست ارتباط سنسورها در شبکه

برای پیاده‌سازی یک بروکر داخلی با استفاده از نرم‌افزار محبوب و متن‌باز Mosquitto، ابتدا باید این سرویس را بر روی یک سرور لینوکسی مانند اوبونتو یا حتی یک رزبری‌پای مستقر در لبه شبکه نصب کنید. فرآیند با دستورات ساده نصب آغاز می‌شود، اما بخش مهندسی آن در تنظیم فایل پیکربندی (mosquitto.conf) نهفته است؛ جایی که شما باید پورت‌های شنود (معمولا 1883 برای ارتباطات ساده و 8883 برای ارتباطات رمزنگاری شده TLS) را تعریف کنید. برای امنیت دیتاسنتر، الزامی است که دسترسی‌های خودمختار غیرفعال شده و برای هر سنسور یا گره لبه، یک نام کاربری و رمز عبور اختصاصی تعریف گردد تا از تزریق داده‌های جعلی به سیستم مانیتورینگ جلوگیری شود. پس از راه‌اندازی سرویس، بروکِر آماده است تا پیام‌ها را از سنسورهای نشت آب یا دما دریافت کند. شما می‌توانید با ابزارهایی مانند MQTT Explorer یا دستورات کلاینت در ترمینال، صحت ارسال و دریافت داده‌ها را تست کنید؛ به این صورت که یک موضوع یا Topic (مثلا datacenter/floor1/leak) ایجاد کرده و با مشترک شدن (Subscribe) در آن، پیام‌های ارسالی از سنسور را به صورت لحظه‌ای مشاهده نمایید.

مزیت استفاده از Mosquitto در محیط داخلی، حذف وابستگی به اینترنت و سرویس‌های ابری است که امنیت داده‌های حساس زیرساختی را به شدت افزایش می‌دهد. همچنین، این بروکِر می‌تواند به عنوان یک پل ارتباطی (Bridge) عمل کرده و داده‌های تصفیه‌شده را به سیستم‌های مانیتورینگ بالادستی مانند Zabbix یا داشبوردهای مدیریتی Grafana ارسال کند. با این روش، شما یک سیستم پیام‌رسان فوق‌سریع و پایدار در اختیار دارید که می‌تواند هزاران رویداد محیطی را در ثانیه با کمترین تاخیر پردازش و هدایت کند، و بدین ترتیب پایداری سیستم مانیتورینگ کف کاذب و سایر اجزای حیاتی را در بالاترین سطح ممکن نگه دارد.

مزایای کنترل غیر متمرکز در دیتاسنترها

مزایای کنترل غیرمتمرکز در دیتاسنترها، ریشه در افزایش چشمگیر تاب‌آوری و کاهش زمان پاسخگویی به بحران‌های زیرساختی دارد. در یک مدل سنتی و متمرکز، خرابی واحد کنترل اصلی یا قطع شدن لینک ارتباطی می‌تواند کل سیستم مانیتورینگ نشت آب، دما و حریق را فلج کند؛ اما در کنترل غیرمتمرکز، هر بخش (مانند یک ردیف رک یا یک اتاق خاص) به صورت مستقل عمل کرده و در صورت بروز حادثه، بدون نیاز به دریافت فرمان از مرکز، واکنش‌های حیاتی نظیر قطع شیرهای برقی یا فعال‌سازی فن‌ها را در کسری از ثانیه انجام می‌دهد که این امر ریسک SPOF (نقطه واحد شکست) را حذف می‌کند.

از سوی دیگر، این رویکرد به شدت باعث مقیاس‌پذیری آسان می‌شود؛ چرا که با افزودن تجهیزات جدید، بار پردازشی بر روی سرور مرکزی انباشته نمی‌شود، بلکه بین گره‌های لبه‌ توزیع می‌گردد. همچنین، با پردازش محلی داده‌ها، پهنای باند شبکه مدیریت برای داده‌های غیرضروری هدر نرفته و تنها گزارش‌های نهایی و هشدارهای مهم به مرکز ارسال می‌شوند که این خود امنیت شبکه را بهبود می‌بخشد. از منظر اقتصادی نیز، کاهش نیاز به سرورهای مرکزی فوق‌قدرتمند و ساده‌سازی کابل‌کشی‌های طولانی، هزینه‌های عملیاتی (OPEX) را کاهش می‌دهد. در نهایت، کنترل غیرمتمرکز امکان نگهداری و تعمیرات را بدون متوقف کردن کل سیستم فراهم می‌آورد؛ به طوری که می‌توان یک گره را برای به‌روزرسانی از مدار خارج کرد، در حالی که سایر بخش‌های دیتاسنتر همچنان با هوشمندی کامل به پایش محیطی خود ادامه می‌دهند و امنیت سرمایه‌های دیجیتال سازمان را در بالاترین سطح ممکن تضمین می‌کنند.

تفاوت‌های سخت‌افزاری کنترلرهای متمرکز (PLC) و کنترلرهای غیرمتمرکز لبه (Edge Controllers)

تفاوت‌های سخت‌افزاری میان PLCهای سنتی (کنترل‌گرهای منطقی برنامه‌پذیر) و Edge Controllers (کنترل‌گرهای لبه مدرن)، ریشه در تکامل از “اتوماسیون صنعتی صلب” به سمت “مدیریت هوشمند و منعطف” دارد. PLCها تجهیزاتی بسیار پایدار و مقاوم هستند که بر پایه سیکل‌های پردازشی خطی و بلادرنگ کار می‌کنند؛ سخت‌افزار آن‌ها به گونه‌ای طراحی شده که دهه‌ها در محیط‌های نویزی دوام بیاورد، اما از نظر توان محاسباتی، حافظه و پروتکل‌های ارتباطی پیشرفته محدود هستند و عمدتا با زبان‌های برنامه‌نویسی خاص صنعت (مانند Ladder) کار می‌کنند. در مقابل، Edge Controllers نسل جدیدی از سخت‌افزارها هستند که قدرت پردازشی مشابه کامپیوترهای صنعتی (IPC) را با پایداری PLCها ترکیب کرده‌اند. این دستگاه‌ها دارای پردازنده‌های چند‌هسته‌ای، حافظه رم بالا و سیستم‌عامل‌های لینوکسی (مانند Ubuntu Core) هستند که به آن‌ها اجازه می‌دهد علاوه بر کنترل سخت‌افزاری، وظایف سنگینی نظیر پردازش کلان داده‌ها، تحلیل‌های مبتنی بر هوش مصنوعی و اجرای کانتینرها (مانند Docker) را مستقیما در لبه شبکه انجام دهند. در حالی که PLCها برای ارتباط با دنیای خارج به گیت‌وی‌های واسط نیاز دارند، Edge Controllerها به صورت بومی از پروتکل‌های مدرن ابری نظیر MQTT، OPC UA و Restful API پشتیبانی می‌کنند. همچنین، از نظر امنیت سایبری، کنترلرهای لبه مجهز به تراشه‌های امنیتی سخت‌افزاری (TPM) و قابلیت‌های رمزنگاری پیشرفته هستند که در PLCهای قدیمی به ندرت دیده می‌شود. در مجموع، PLCها برای فرآیندهای تکراری و حساس به زمانِ مطلق (مانند خط تولید) بی‌رقیب هستند، اما Edge Controllerها برای مدیریت دیتاسنترهای مدرن که نیازمند تحلیل هوشمند، کنترل غیرمتمرکز و اتصال مستقیم به سیستم‌های نرم‌افزاری و مانیتورینگ تحت وب هستند، گزینه‌ای بسیار کارآمدتر و آینده‌نگرانه‌تر محسوب می‌شوند.

کلام آخر

همان‌گونه که مشاهده کردید، در معماری‌های سنتی، مدیریت مراکز داده به‌صورت متمرکز انجام می‌شود؛ جایی که تمام داده‌های مربوط به وضعیت زیرساخت (دما، مصرف انرژی و ترافیک شبکه) به یک واحد مرکزی ارسال شده و پس از پردازش، دستورات کنترلی صادر می‌گردد. با افزایش مقیاس مراکز داده و ظهور مفاهیمی مانند مراکز داده لبه، این رویکرد با چالش‌هایی نظیر تاخیر بالا و بار بیش از حد بر پهنای باند مواجه شده است. راهکار نوین برای عبور از این چالش، بهره‌گیری از کنترل غیرمتمرکز با تکیه بر توان پردازشی در لبه شبکه است.

در این مدل، هوشمندی از هسته مرکزی به نزدیکی منابع تولید داده، یعنی همان رک‌ها و نودهای لبه، منتقل می‌شود. هر واحد لبه مجهز به الگوریتم‌های محلی است که می‌توانند به‌طور مستقل و در لحظه، متغیرهای حیاتی را پایش کنند. برای مثال، سیستم‌های HVAC و توزیع توان الکتریکی دیگر منتظر دستور از مرکز کنترل نمی‌مانند؛ بلکه با تحلیل داده‌های سنسورهای محلی، دمای هر راهرو یا بار پردازشی هر سرور را به‌صورت خودکار تنظیم می‌کنند. این امر نه تنها سرعت واکنش سیستم به نوسانات حرارتی را افزایش می‌دهد، بلکه با حذف نقطه واحد شکست (Single Point of Failure)، تاب‌آوری کل مرکز داده را به شدت بهبود می‌بخشد.

علاوه بر این، در کنترل غیرمتمرکز، ارتباط بین نودهای لبه از طریق پروتکل‌های توزیع‌شده مانند Multi-agent Systems برقرار می‌شود. این نودها با تبادل حداقل اطلاعات، به یک تعادل بهینه در کل سیستم دست می‌یابند که منجر به کاهش چشمگیر مصرف انرژی می‌گردد. در واقع، رایانش لبه با محلی‌سازی فرآیند تصمیم‌گیری، مرکز داده را از یک ساختار آهسته، به یک موجودیت ارگانیک و پویا تبدیل می‌کند که قادر است در کسری از ثانیه با تغییرات بار کاری و محیطی سازگار شود.

اشتراک‌گذاری
نویسنده
تصویر حمیدرضا تائبی
حمیدرضا تائبی
مطالب مشابه
برای دریافت مشاوره و یا اطلاع از قیمت، با ما در تماس باشید.