در پی آغاز محدودیتهای اینترنت در ماه های گذشته، زیرساخت شبکه داخلی و اینترنت بینالملل با مشکلات و ناپایداریهای متناوبی روبهرو بوده است. در طول این مدت شبکه اَبر دِراک نیز تحت تاثیر این ناپایداریهای شدید قرار گرفته است و علیرغم تلاش برای حفظ کیفیت سرویس کاربران سرویسهای اَبری، متاسفانه در بیشتر مواقع شاهد اختلال در سرویسهای ابری اَبر دِراک بودهایم. این اختلالها علاوه بر تحمیل هزینههای گزاف در بخش پشتیبانی و نگهداری شبکه، در نهایت عدم رضایت کاربران از سرویسهای ابری را نیز در پی داشته است. در این گزارش قصد داریم به مشکلاتی که کیفیت سرویسهای ابری اَبر دِراک را تحت تاثیر قرار دادهاند و اقدامات اَبر دِراک برای برطرف کردن این مشکلات بپردازیم:
مشکلات در ارتباطات SSH
ارتباط SSH به صورت معمول از برخی پروایدرهای اینترنت به خارج و از خارج به داخل با اختلالاتی روبهرو بوده است؛ این اختلالات از اواسط آبان ماه تا اواسط دی به اوج خود رسید و از آن زمان به طور ثابت به یک اختلال روزانه در ارتباطات شبکه تبدیل شده است. در شرایط نرمال ارتباطات SSH روزها میتواند برقرار بماند در صورتی که این ارتباط در موارد بسیاری به طور کامل میشود. با شرایط فعلی حتی در صورت برقراری ارتباط نیز، این ارتباطات با تاخیر بسیار زیادی روبهرو بودند؛ همچنین تجربههایی از باز نشدن سایر پورتهای well-known امن مانند پورت های Remote Desktop و Email هم وجود داشته است.
در بعضی از روزها و ساعات، ارتباطات SSH داخل به داخل هم دچار مشکل (به صورت عمده در شبکه ی اینترنت موبایل) بوده است. در نتیجه این مشکلات، کاربران سرویسهای سرورهای ابری در اتصال به سرویسهای خود دچار مشکل شدهاند و همچنین در اتصال سرویسهای خود به خارج از کشور یا اتصال سرویسهای خارج از کشور به داخل نیز ناموفق بودهاند.
اختلالات دایرکت ادمین
بسیاری از کاربران سرورهای اَبری اَبر دِراک از نرمافزار دایرکت ادمین بر روی سرور مجازی خود استفاده میکنند. بر اساس گزارشهای دریافت شده از تیم پشتیبانی اَبر دِراک در دو ماه اخیر، این نرمافزار در اتصال به سرور لایسنس خود برای برخی از آپدیتهای ضرروی با مشکل مواجه بوده است. این عدم اتصال به دلیل مشکلاتی بوده است که هم اکنون در برقراری ارتباط بر بستر TLS وجود دارد. این مساله در برخی از موارد باعث از دسترس خارج شدن این نرم افزار برای برخی کاربران این نرم افزار شده است.
مشکلات مسیرهای بینالملل
یکی از انتخابهای محبوب کاربران اَبر دِراک برای در اختیار داشتن سرور خارجی، سرورهای پاپسایتهای کشور آلمان است. اخیرا اتصال به سرورهای این کشور با مشکلات زیادی روبهرو بوده است. ping با تاخیر بسیار زیاد و اختلال TLS از جمله مشکلاتی بوده است که کاربران سرورهای اَبری های خارجی مخصوصا کشور آلمان تجربه کردهاند. این عمدتا مشکلات از اختلالات در مسیرهای IXP موسوم به DIEX نشات میگیرند.
مشکل دسترسی به برخی از وبسایتها
در بازههای زمانی مختلف، وبسایتهایی که سرور اصلی آنها در خارج از کشور قرار دارند و از CDN اَبر دِراک استفاده میکنند، در دسترسی کاربران ایرانی به وبسایت خود دچار مشکلاتی شدهاند. این مشکلات به دلیل اختلال در مسیر دسترسی کاربران داخل به خارج از پاپ سایتهای داخلی بوده است و در برخی موارد با وجود استفاده از راهکارهای خودکار برای برقراری مجدد مسیر بهینه جایگزین کماکان تا ساعت ها با اختلال روبرو بوده است.
مشکلات موقتی IP
اختلالات یک ماه اخیر روی اپراتورهای ایرانسل و همراه اول که بر روی تک IP یا یک رنج IP وجود داشته است، باعث ایجاد مشکلاتی برای سرویسهای کاربران سرورهای ابری شده است. پس از پیگیریهای مستقیم تیم پشتیبانی با این پروایدرها برای اکثر این مشکلات دلیل مشخصی کشف نشد، و این اختلالات پس از چند ساعت به صورت اتفاقی برطرف شدهاند. به نظر میرسد این مشکلات با ایجاد و پیاده سازی استاندارد های جدید از سوی پروایدرها که در شبکه ی آنها اجرایی شده یا از تامینکنندههای بالا دستی آنها مانند شرکت زیرساخت ایجاد شده است.
دسترسی ناموفق به وبسایتها از پروایدرهای متفاوت
یکی از مواردی که به وفور به تیم پشتیبانی سرویس CDN اَبر دِراک گزارش شده است، عدم دسترسی کاربران برخی پروایدرها به وبسایتهایی بوده است که از CDN اَبر دِراک استفاده میکردند. مشکلات دسترسی به سرویسهای اَبر دِراک از برخی پروایدرها شامل عدم اتصال کاربران به سرورهای ابری نیز بوده است. این موارد در اکثر مواقع با پیگیری های مداوم با سرویس دهنده های بالا دستی پیگیری و رفع میگردد.
ناپایداری در ارتباطات RDP (Remote Desktop)
در حال حاضر این پروتکل ارتباطی در داخل با کندی و قطعیهای مقطعی مواجه است. در سه ماه گذشته، این شرایط برای اتصال به سرورهای اَبری خارج از کشور با ناپایداریهای شدیدتری مواجه و در اکثر مواقع نیز بدون نتیجه بوده است. همچنین ارتباطات با سرورهای خارج از کشور نسبت به ارتباط داخلی با کندیهای چندین برابری روبهرو بوده است و به طور میانگین هر چند ثانیه یک بار ارتباط قطع شده است. به دنبال این مشکل، کاربران اَبر دِراک در اتصال به سرورهای خود با کندی و قطعیهای بسیار زیادی روبهرو شدهاند.
مشکل در استفاده از سرویسهای خارجی
برخی از گزارشهای کاربران اَبر دِراک حاکی از مشکلاتی در استفاده از سرویسها و نرمافزارهای خارجی در شبکه ابری است. برای مثال مشکلات در استفاده از apt-get، yum یا lookup کردن آدرس در DNS نمونههایی از مشکلات گزارش شده به تیم پشتیبانی اَبر دِراک است. این مشکلات به دلیل ناپایداریهای اینترنت بینالملل در شبکه اَبر دِراک گزارش شده است. همچنین override کردن داده های تبادلی بستر DNS برای Forwarder های معروف هم در برخی مسیر ها مشاهده شده که از عوامل مشکلات فوق ارزیابی میگردد.
کیفیت اینترنت
در ساعاتی از شبانهروز کیفیت اینترنت به صورت متناوب با افت شدیدی روبهرو بوده است و این موضوع باعث کاهش کیفیت تجربه کاربران اَبر دِراک از سرویسهای شبکه توزیع محتوا و سرور اَبری شده است. این افت کیفیت به دلیل packet lost های شدید در اثر اعمال محدودیتهای اخیر است. همچنین کیفیت مسیر های دسترسی به اینترنت داخلی و خارجی در ساعات روز و شب بسیار متفاوت و با نواسان کیفی بالا روبرو بوده است.
مشکلات IXP
اختلال های اخیر IXP در هفتههای گذشته از آزاردهندهترین اختلالات اخیر بستر اینترنت در ماه های گذشته بوده است. عدم پایداری در اینترنت در نتیجه اختلال بروی سوییچ IXP باعث مشکلاتی در ارتباط با پراوایدر های اینترنت و در نتیجه ناپایداری در سرویس های اَبر دِراک بوده است.
قطعی IXP از دو جنبه بر سرویس های ابر دراک تاثیر گذار بوده است : جنبه اول اختلال در ارتباط بین زیرساخت ابر دراک با پروایدرهای اینترنت که ابر دراک از آن ها سرویس میگیرد بوده است. اختلال در سوییچ های IXP در این مورد باعث اختلال در این ارتباط بوده و این موضوع در سرویس های اَبر دراک با افت کیفیت سرویس دهی و پهنای باند مد نظر کاربران ظاهر شده است. و جنبه دوم مشکل در IXP باعث ایجاد اختلال در دسترسی کاربران به اینترنت اتفاق افتاده است. در مواردی سرویس های اَبر دِراک در زمان اختلال سوییچ IXP در مسیرهای جایگزین دارای پایداری در سرویس دهی بوده اند، اما به دلیل عدم توانایی کاربران در دسترسی به این سرویس ها در نهایت کاربران در استفاده از سرویس های اَبری خود دچار مشکل شده اند.
خلاصه ای از مشکلات عمده کاربران سرویسهای اَبر دِراک
بیشترین گزارشها به دنبال اختلال در اتصال به سرورهای اَبری و از داخل سرورهای اَبری به سرویسهای مورد نظر کاربران گزارش شده است که عموما با گذشت چند ساعت از پیگیری به صورت اتفاقی رفع میگردد و سپس با گذشت مدت زمانی مجددا تکرار میشود. این روند مدیران شبکه را خسته و مرتبا درگیر حل مشکلاتی کرده است که دلیل آنها مشخص نیست و در بسیاری از مواقع هم این تلاش بینتیجه میماند.
از شروع ناپایداریهای اینترنت بیشترین مشکلات کاربران سرویسهای اَبر دِراک را میتوان ناشی از اختلالات SSL و TLS دانست. در مدت اخیر، کاربران سرویسهای ابری، خطاهای 502 و 504 را بیشتر از هر زمان دیگری مشاهده میکنند. عموما این خطاها به دلیل قطع ارتباط مقطعی در اتصال به سرورها یا عدم اتصال به سرورهای اَبر دِراک در نتیجه مشکلات ارتباطی حال حاضر رخ میدهند. همچنین، کاربران سرویس CDN اغلب با خطای timeout مواجه هستند. این مورد نیز به دلیل افزایش packet lost و زمان اتصال زیاد به سرویسهاست. به طور کلی، در سرورهای ابری اتصال سرورها به سرویسهای خارجی و اتصال هاست به پاپسایتهای داخلی با اختلال یا عدم اتصال رو به روست.
اَبر دِراک در مدت اخیر تمام توان فنی خود را به کار گرفته است تا مشکلات ارتباطات اخیر در کیفیت سرویسدهی به کاربران کمترین تاثیر را داشته باشد. در همین راستا، اَبر دِراک با درخواست از کابران برای دریافت کامل مستندات مربوط به گزارشهای اختلالات دریافتی از کاربران خود سعی کرده است که درک درستی از ریشه و دلایل مشکلات به دست آورد و با ایجاد تغییراتی در سرویس کاربران در مرحله نخست و در مرحله بعد با مذاکرات با پروایدرهای بالادستی به برطرف کردن این اختلالات کمک کند. در بسیاری از موارد این پیگیریها به دلیل اینکه بسیاری از این اختلالها دلیل مشخصی ندارند، قابل کشف و حل شدن نیستند و در برخی موارد به صورت اتفاقی پس از چند ساعت حل میشود.