مانیتورینگ شبکه

مقدمه

مانیتورینگ شبکه بخش بسیار مهمی از عملیات مدیریت شبکه و امنیت آن محسوب می شود و برای بسیاری از وظایف حیاتی مورد استفاده قرار می گیرد. یک عملکرد عمده در مانیتورینگ شبکه، شناسایی زود هنگام روندها و الگوهای ترافیک شبکه و دستگاه ها است.

براساس این سنجش ها، اپراتورهای شبکه وضعیت جاری شبکه را درک نموده و سپس این شبکه را برای یک وضعیت بهبود یافته، مجدد تنظیم می کنند. برای مثال اپراتور شبکه یک افزایش چشمگیر در ترافیک P2P مشاهده می کند که باعث از بین رفتن عمده بسته ها می شود.

برای پاسخ به این مشکل، اپراتورمحدودیت پهنای باند برای ترافیک P2P اعمال می کند. اپراتورها ممکن است آسیب پذیری هایی که ممکن است باعث دسترسی غیرمجاز به اطلاعات حساس در سرورهای بانک اطلاعاتی شود را کشف کرده و سپس اقدام به رفع آنها در این سرورها نماید. تاخیر در شناسایی این قبیل رخدادها می تواند منجر به اختلال طولانی مدت در ارائه خدمات شده و خسارت های مالی زیادی را به سازمان یا شرکت ها تحمیل نماید.

مانیتورینگ شبکه به دلیل گستردگی فضای عملکرد و پیچیدگی آن، نیاز به صرف زمان زیاد برای اقدام و کشف ایرادات شبکه دارد. یکی از چالش هایی که مدیران شبکه و سازمان ها با آن روبرو هستند، نبود یک سامانه یکپارچه و کارا در مانیتورینگ شبکه است که بتواند به آنها کمک نماید.

به عنوان مثال در صورت قطع شبکه و دسترسی به منابع اطلاعاتی به مدت چندین ساعت و نبود آگاهی به موقع از این امر توسط اپراتورها و مسئول شبکه، یک سازمان ممکن است هزینه های بسیاری را صرف رفع آن مشکل نماید در صورتی که می توانست این هزینه ها را صرف تامین تجهیزات از جمله مانیتورینگ و ارائه خدماتی نماید که ارزش افزوده ای را برای سازمان به همراه داشته باشد.

موقعیت مانیتورینگ در چرخه عملیاتی مدیریت شبکه

در مدیریت یک شبکه، اپراتورهای شبکه از دو نوع منبع داده استفاده می کنند: سنجش ها (measurements) و تنظیمات (configuration).

سنجش ها، رفتار فعلی شبکه را نشان می دهد و شامل بسته های جمع آوری شده از نقاط برتری (vantage points) مختلف و همچنین اطلاعات دستگاه های خاص پویا مانند میزان ترافیک شبکه، لود پردازنده و ورودی جداول هدایت در روترها است.

تنظیم یک ابزار شبکه شامل مجموعه ای از دستورها و پارامترهای دستگاه خاص است. این دستورها و پارامترها رفتار مورد نظر دستگاه را مشخص می کند: چگونه دستگاه باید عمل کند، چه پروتکل هایی باید اجرا شود، گزینه های پروتکل چه مقادیری باید اتخاذ کنند. تنظیمات همچنین شامل اطلاعاتی درباره اتصال منطقی و فیزیکی بین دستگاه های شبکه است.

سنجش ها و تنظیمات بوسیله سه گروه عملیاتی مانیتورینگ، طراحی و استقرار به صورت زیر استفاده می شود:

عملیات مانیتورینگ، سنجش ها را جمع آوری کرده و آنها را به منظور پی بردن به رفتار فعلی شبکه تحلیل می کند. با در نظر گرفتن این رفتار فعلی، عملیات طراحی تغییرات لازم را در تنظیمات و زیرساخت اعمال می کند. در عملیات طراحی شبکه، نیازمندی های برنامه های کاربردی از آنها دریافت شده سپس جهت راه اندازی، تنظیم و اهداف عملیاتی روی زیرساخت های فیزیکی نگاشت شده و تغییرات لازم طرح ریزی می شود.

تغییرات برنامه ریزی شده در شبکه در جریان عملیات استقرار، پیاده سازی و اجرا می شود. هدف اصلی عملیات استقرار، به حداقل رساندن قطعی ها در یک شبکه فعال در هنگام اعمال تغییرات روی شبکه است.

به عنوان مثال در عملیات مانیتورینگ که اپراتور شبکه به طور مداوم و پویا تمامی وضعیت شبکه را نظارت و بررسی می کند پس از تحلیل در هنگام سنجش میزان ترافیک روی روتر و میزان استفاده از پردازنده آن مشخص می شود که روی یک لینک تراکم بالا است. حال این مورد به عملیات طراحی انتقال می یابد و در آنجا هدف گذاری می شود که لود نزدیک به روتر مورد نظر کاهش یابد برای این منظور و با توجه به زیرساخت فعلی، باید یک روتر جدید اضافه شده، لینک مورد نظر به روز و تغییرات روی تنظیمات سایر روترها و تجهیزات اعمال شود.

در نهایت در عملیات استقرار، تجهیزات جدید در شبکه جایگزاری، نصب و پیکربندی می شود و تنظیمات روی سایر روترها نیز اعمال می شود. پس از آن عملیات مانیتورینگ روی تمامی تجهیزات و سامانه ها باید به عنوان یک عملیات مستمر ادامه یابد.

عملیات مانیتورینگ در یک شبکه، یک مدل شبکه را با جمع آوری و تحلیل سنجش ها بوجود می آورد. این مدل شبکه به طور گسترده در عملیات طراحی شبکه به عنوان مرجع تنظیمات تجهیزات فعلی و جدید و شناسایی عدم تطابق بین رفتار فعلی و رفتار مورد انتظار شبکه مورد استفاده قرار می گیرد.

نکته: عدم تطابق در رفتار فعلی و رفتار مورد انتظار شبکه به دلایل زیر رخ می دهد:

  • معایب سخت افزاری یا نرم افزاری تجهیزات شبکه
  • تنظیمات اشتباه (اغلب توسط عامل انسانی بوجود می آید)
  • انحراف از فرضیات و پیش بینی های صورت گرفته در خصوص وضعیت شبکه

فرضیات و پیش بینی ها در مورد یک شبکه و تجهیزات آن براساس سنجش های قبلی و نیازهای برنامه ها و کاربران در نظر گرفته شده است. انحراف صورت گرفته از فرضیات و پیش بینی ها در مورد یک شبکه ناشی از رخدادهای نابهنگام و غیرمترقبه در مورد تجهیزات و پیکربندی شبکه است. یک افزایش نابهنگام و پیش بینی نشده در ترافیک شبکه و تهدیدات ناشی از حملات به شبکه نمونه های از آن است. اپراتور شبکه با طراحی مجدد و پیکربندی مجدد تجهیزات می تواند به این ناهنجاری ها و عدم تطابق ها پاسخ دهد.

اپراتورهای شبکه زمان زیادی را برای مانیتورینگ و حل مشکلات شبکه صرف می کنند و این در حالی است که نیمی از خطاها ناشی از تنظیمات نادرست است. برای حل این مشکل و افزایش دقت در طراحی سه رویکرد وجود دارد:

  • بهبود دقت در طراحی تنظیمات با استفاده از سامانه های ارزیابی تنظیمات که بتواند خطاهای تنظیمات را قبل از اجرای تغییرات طراحی، شناسایی کند. به عنوان مثال کنترل کننده تنظیمات روتر (router configuration checker) نرم افزاری است که خطاهای مربوط به روترها را در بین دامنه ها تشخیص می دهد.
  • بهبود عملیات طراحی با استفاده از ساده سازی تنظیمات و پیکربندی از طریق حذف بخش های اضافی و غیرلازم
  • استفاده از روش ها و سامانه های مجازی سازی

لایه های منطقی عملیات مانیتورینگ

عملیات مانیتورینگ را می توان به طور منطقی در پنج لایه سنجش، تقسیم بندی کرد: جمع آوری، نمایش، گزارش، تحلیل و ارائه. این لایه ها از نظر منطقی جدا بوده ولی به منظور یک عملیات مانیتورینگ مناسب این لایه ها با یکدیگر در تعامل هستند.

لایه جمع آوری (Collection) داده های سنجش خام را از شبکه جمع آوری می کند.

این داده ها پردازش شده و به صورت یک فرمت خاص و مشخص در لایه نمایش (Representation) قرار می گیرند. این فرمت اغلب از عملکرد مدیریت مستقل بوده بنابراین می تواند در عملکردهای مدیریتی مختلف استفاده شود.

لایه گزارش (Report) داده های جمع آوری شده مدیریتی را از تعدادی تجهیزات شبکه به لایه بالاتر مدیریتی انتقال می دهد.

لایه تحلیل (Analysis)، داده سنجش را تجزیه و تحلیل کرده و تفسیر سطح بالاتری از داده های جمع آوری شده را استخراج می کند. دو تابع تحلیلی در این لایه شامل دسته بندی ترافیک و تشخیص خطا است.

لایه ارائه (Presentation)، داده سنجش را در فرمت های متفاوت گرافیکی و متنی به اپراتور شبکه ارائه می دهد.

نکته مهم این است که این لایه ها به صورت منطقی بوده و مولفه های لایه های مختلف می تواند در یک ابزار فیزیکی یا سامانه نرم افزاری یا چندین سامانه و ابزار مختلف پیاده سازی شود.

هر یک از لایه ها وظیفه ای به عهده دارند که به شرح زیر است:

لایه جمع آوری:

  • مانیتورینگ فعال و غیرفعال: مانیتورینگ فعال شامل تزریق ترافیک تست به شبکه و مانیتور کردن جریان ترافیک و تخمین زمان طی کردن مسیر توسط بسته ها و نرخ از دست رفتن بسته ها در شبکه و طرفیت و توان عملیاتی یک لینک است. مانیتورینگ غیرفعال شامل نمونه گیری و کپی برداری از ترافیک شبکه و عملکرد تجهیزات شبکه مانند لود پردازنده و میزان حافظه به صورت مشاهده ای است. در بیشتر موارد مانیتورینگ غیرفعال مورد استفاده قرار می گیرد.
  • نمونه برداری: به منظور کاهش حجم سربار نودهای شبکه و افزایش کارایی مانیتورینگ به کار می رود و نمونه برداری از بخشی از جریان شبکه به منظور استنتاج وضعیت کلی شبکه است. هر چه نرخ نمونه برداری بیشتر باشد دقت در سنجش وضعیت شبکه بهتر است. در زمانی که از این تکنیک استفاده می شود انتخاب فاکتورهای نمونه گیری بسیار مهم است تا دقت سنجش افزایش یابد.

لایه نمایش:

  • استاندارد سازی فرمت سنجش ها: نرمال کردن لاگ های جمع آوری شده براساس یک فرمت مشخص پس از جمع آوری از دستگاه ها و تجهیزات شبکه ضروری است.
  • همزمانی سنجش ها و اندازه گیری ها: به منظور قابل استفاده بودن و تحلیل پذیر بودن سنجش ها باید تجهیزاتی که از آنها اطلاعات و لاگ جمع آوری می شود، از یک زمان یکسان برخوردار باشند.
  • فشرده سازی لاگ ها: به دلیل محدود بودن فضای ذخیره سازی و پهنای باند شبکه، فشرده سازی لاگ ها و سنجش ها امری مهم است.

لایه گزارش:

  • ادغام گزارشات اضافی، زائد با ویژگی مشابه در هنگام انتقال از دستگاه های جمع آوری داده ها تا ایستگاه مدیریت
  • کدگذاری سنجش ها به منظور حفظ پهنای باند
  • گزارش گیری به صورت دوره ای و طی بازه زمانی متناوب (کارایی کمتر به علت حجم بالای جمع آوری و دقت بیشتر)
  • گزارش گیری براساس رخدادهای از پیش تعریف شده (کارایی بیشتر و دقت کمتر در صورت تعریف نامناسب رخداد)

لایه تحلیل

  • تحلیل ترافیک همه منظوره و جریان شبکه: تطابق وضعیت فعلی با مقادیر آستانه و صدور هشدار، پیش بینی وضعیت بعدی سنجش ها مبتنی بر تاریخچه و الگوریتم های پیش بینی، ادغام سنجش هایی با ویژگی مشابه، نمونه هایی از ترافیک همه منظوره است.
  • تخمین حجم ترافیک مورد نیاز در مبادی ورودی و خروجی
  • دسته بندی ترافیک براساس هر برنامه کاربردی: به دلیل بهبود عملکرد ترافیک برای توزیع ترافیک هر برنامه، دسته بندی ترافیک صورت می گیرد. این دسته بندی می تواند براساس شماره پورت مورد استفاده برنامه با دو رویکرد payload-based یا رویکرد رفتار مبتنی بر میزبان انجام می شود. در روش دقیقتر آن از نوع پروتکل، سایز بسته، TCP flags و ویژگی جریان استفاده می گردد.
  • استخراج الگوهای ارتباطی: این مورد به منظور گروه بندی میزبان ها و الگوی های استفاده از منابع و استخراج دانشی درباره میزان استفاده واقعی از لینک ها، پروتکل ها، سرورها و برنامه های کاربردی است.
  • مدیریت خطا: مدیریت خطا شامل شناسایی خطا (وجود خطا در شبکه با استفاده از مانیتور مستمر و بهره برداری از سایر لاگ ها) و موقعیت یابی آن(کشف علت ریشه ای بروز خطا و محل وقوع آن با استفاده از ایجاد گراف وابستگی های بین اجزای شبکه) است.
  • به روز رسانی خودکار مستندات شبکه: مستندات شبکه شامل توپولوژی شبکه، سیاست ها و تنظیمات است که هر گونه تغییر باید در آن ثبت شده و متناسب با تغییرات، مستندات اصلاح می گردد.

لایه ارائه:

  • نمایش گرافیکی عملیات مانیتورینگ: یکی از مهمترین بخش های یک سیستم مانیتورینگ، نمایش مناسب اطلاعات به اپراتور شبکه است تا بتواند تصمیمات مناسبی را در خصوص آن بگیرد. این در حالی است که نمایش این اطلاعات توسط سیستم مانیتورینگ یک چالش محسوب می شود تا بتوان اطلاعات مهم را به طور مجزا نمایش داد و یک نمایش مناسب، خلاصه و کاربردی از اطلاعات، نمایش الگوهای ارتباطی و هشدارهای مناسب و… را به همراه داشت. لذا انتخاب سیستمی که بتواند نمایش مناسبی داشته باشد، بسیار مهم است.

ملاحظاتی در انتخاب یک سامانه مانیتورینگ

در انتخاب یک سامانه مانیتورینگ باید ملاحظات زیر را در نظر گرفت:

  • سامانه مانیتورینگ به طور منطقی از معماری لایه ای پشتیبانی کرده و  به صورت یکپارچه پیاده سازی شده باشد.
  • سامانه مانیتورینگ باید قابلیت بهبود کارایی، دقت و انعطاف پذیری در مانیتورینگ شبکه و تجهیزات آن را داشته باشد. افزایش کارایی به معنی کاهش سربار از ابزارهای مانیتورینگ، کاهش مصرف پهنای باند شبکه، جایگزاری مناسب ابزار جمع آوری وکاهش هزینه نگهداری است. افزایش دقت به معنی ایجاد مدل شبکه ای با جزئیات زیاد و خطای کم است. افزایش انعطاف پذیری نیز به معنی سادگی در تغییرات و اصلاحات اهداف مانیتورینگ و داده های اندازه گیری شده است.
  • مدیریت داده های حجیم ذخیره شده، تحلیل شده و نمایش داده شده توسط یک سامانه مانیتورینگ بسیار مهم است. از آنجایی که اطلاعات جمع آوری شده به سرعت افزایش می یابد یک سامانه مانیتورینگ باید بتواند این حجم عظیم از داده ها را به درستی ذخیره، پردازش و تحلیل و برای اپراتور نمایش دهد. به منظور کاهش حجم داده های جمع آوری شده بدون کاهش دقت در تحلیل آنها، قابلیت ها و ویژگی خاص سامانه و تجربه کارشناسان در راه اندازی این سامانه، از مهم ترین مواردی است که باید در نظر گرفت. بدون کاهش حجم داده می توان با استفاده از سخت افزارهای قدرتمند و سامانه ای با قابلیت ذخیره سازی توزیع شده داده ها در سرورهای مختلف و پردازش توزیع شده این عملیات را انجام داد.

با توجه به ویژگی های سامانه مانیتورینگ اشاره شده در این مقاله، انتخاب یک سامانه مانیتورینگ مناسب که بتواند نیازهای یک سازمان را در خصوص مدیریت شبکه و امنیت آن تامین نماید، به عنوان یک چالش جدی مطرح است لذا با شناخت صحیح نیازهای سازمان، مطالعه دقیق ویژگی های عمومی و منحصر بفرد سامانه های مختلف، مشارکت و مشاوره با شرکت های پیشرو در این حوزه که تجربه اجرای پروژه های مانیتورینگ را دارند و از همه مهمتر نگاهی به تحلیل هزینه- فایده برای انتخاب این سامانه ها و استفاده از سامانه های متن باز قدرتمند و انعطاف پذیر می توان راه حل مناسبی را برای آن در نظر گرفت.

برای اطلاعات بیشتر می‌توانید با شرکت سدیدآفرین در ارتباط باشید.

مرجع

Lee, S., Levanti, K. & Kim, H. S., 2014. Network monitoring: Present and future. Computer Networks, Volume 65, p. 84–98.