Cloudflare تكشف عن سبب الانقطاع المفاجئ لخدمات الإنترنت على مستوى العالم أمس

كشفت شركة Cloudflare عن تفاصيل جديدة بشأن الانقطاع الكبير الذي حدث في خدمات الإنترنت يوم الثلاثاء الماضي، حيث أدى هذا العطل إلى توقف مؤقت لعدد من الخدمات الهامة مثل ChatGPT، وأشارت الشركة إلى أن السبب كان يتعلق بإعداد استعلام غير صحيح في نظام إدارة الروبوتات الخاص بها، مما أثر بشكل كبير على أجزاء واسعة من الإنترنت لعدة ساعات.

في تدوينة نشرها ماثيو برينس، المؤسس المشارك والرئيس التنفيذي لشركة Cloudflare، أشار إلى أن هذا الحادث يعتبر “أسوأ انقطاع منذ عام 2019″، وكشف أن المشكلة كانت متعلقة بنظام إدارة الروبوتات الذي يتحكم في برامج الزحف المعتمدة على شبكة CDN الخاصة بالشركة. وأكد برينس أن هذا النظام صُمم ليضمن السيطرة على حركة المرور ويمنع الازدحام.

من المثير للاهتمام أن نحو 20% من حركة الإنترنت العالمية تمر عبر شبكة Cloudflare، مما يجعلها نقطة محورية في استمرارية عمل العديد من المواقع الالكترونية، ورغم ذلك، أدى العطل الأخير إلى توقف عدة خدمات شهيرة كـX وChatGPT وDowndetector لفترة طويلة، وهو ما يعيد إلى الأذهان انقطاعات سابقة مشابهة.

عقب الحادث، أكدت Cloudflare أن المشكلة لم تكن نتيجة لهجوم إلكتروني أو تقنية الذكاء الاصطناعي المستخدمة لديها، بل كانت نتيجة لتغيير في إعدادات قاعدة البيانات. حيث أدى هذا التغيير إلى إنشاء نسخ مكررة من المعلومات داخل النظام، ما تسبب في تخطي حدود الذاكرة المخصصة وتعطيل النظام الأساسي المسؤول عن إدارة حركة البيانات.

لتجنب تكرار تلك المشكلة، وضعت Cloudflare خطة تتضمن أربع خطوات رئيسية تهدف إلى تعزيز استقرار النظام ومنع الأعطال المستقبلية، حيث تشمل هذه الخطوات تعزير استيعاب ملفات التكوين، وتمكين مفاتيح طوارئ عالمية، وإزالة بعض قدرات النظام التي قد تستنزف الموارد، إضافة إلى مراجعة أوضاع الفشل لضمان استقرار الأنظمة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

الأقسام