Online: 773 online | Members: 0 | Guests: 773
یکشنبه, خرداد 16, 1405

متخصصان IT برای تفکر در لایه ها استفاده می شوند: سخت افزار، شبکه ها، نرم افزار، هویت، سیاست و عملیات. فضا به راحتی نادیده گرفته می شود، زیرا احساس می کند “بالاتر از پشته” است. با این حال، مقدار فزاینده ای از آنچه ما “اینترنت”، “ابر” و “زمان جهانی” می نامیم به زیرساخت های مداری بستگی دارد. اثر Kessler یک یادآوری است که حتی یک سیستم بسیار پیشرفته می تواند از انعطاف پذیر به شکننده هنگامی که تراکم و سرعت ترکیب در راه اشتباه است.

این مقاله اثر Kessler را در شرایط عملی توضیح می دهد، سپس آن را به زبان خطر تبدیل می کند که برای معماران، SREs، CISO، تیم های شبکه ای و صاحبان تداوم کسب و کار منطقی است. هدف ترس نیست، بلکه آمادگی: درک آنچه که حالت شکست به نظر می رسد، چه سیگنال هایی برای نظارت و چگونگی طراحی محافظان عملیاتی در دنیایی که خدمات مداری دیگر اختیاری نیست.

kessler-effect-too-much.webp

اثر Kessler در واقع به معنای

اثر Kessler یک سناریو است که در آن زباله های فضایی در یک گروه مداری خاص بسیار فراوان می شوند که برخوردها زباله های بیشتری را نسبت به پوسیدگی طبیعی یا حذف می کنند. هر برخورد قطعاتی را ایجاد می کند؛ قطعات احتمال برخورد های آینده را افزایش می دهند؛ برخوردهای آینده حتی قطعات بیشتری ایجاد می کنند. این یک حلقه بازخورد ترکیبی است، شبیه به شکست های قفسه ای که ممکن است از سیستم های توزیع شده تشخیص دهید.

اصطلاح " آبشار فرار" اغلب استفاده می شود، اما به خاص بودن کمک می کند. در مدار زمین پایین (LEO)، اشیا با سرعت های فوق العاده ای نسبت به یکدیگر سفر می کنند. در این مکان ها، حتی قطعات کوچک می توانند ماهواره ها را غیرفعال کنند و یک برخورد منفرد می تواند یک ابر از زباله هایی ایجاد کند که بسیاری از مدارها را مختل می کند. در طول زمان، یک منطقه مداری شلوغ می تواند به اندازه کافی خطرناک باشد که عملیات روزمره به مانورهای اجتناب دائمی مجبور می شود و در نهایت منطقه از نظر اقتصادی یا فنی غیر عملی می شود.

نکته مهم این است که اثر Kessler در مورد یک رویداد دراماتیک "فضای پایان" نیست. در مورد محیطی است که به طور فزاینده ای به عملیات قابل اعتماد و طولانی مدت تبدیل می شود. این به طور تدریجی در نتیجه، اما می تواند در ماشه اگر توده و چگالی به اندازه کافی تراز.

چرا IT باید به ترافیک مداری اهمیت دهد

بسیاری از سازمان ها به فضا بستگی دارند که آیا آن را درک می کنند یا نه. سیستم های ماهواره ای به ارتباطات جهانی، اتصال از راه دور، ارتباطات دریایی و هوایی، پاسخ اضطراری، پخش، مشاهده زمین و ناوبری کمک می کنند. حتی هنگامی که ترافیک برنامه شما فیبر را سوار می کند، زمان شما اغلب ماهواره ها را سوار می کند و زمان بندی یک وابستگی آرام برای احراز هویت، ورود، قانونی، سیستم های مالی و پایگاه های داده توزیع شده است.

به فضا به عنوان یک ارائه دهنده بالا با محدودیت های منحصر به فرد فکر کنید: لینک های تاخیر بالا، طیف محدود، بودجه های قدرت دقیق و یک محیط فیزیکی که در آن تعمیر و نگهداری یک رول کامیون نیست. همچنین یک رسانه مشترک است: ازدحام نه تنها مشکل شما است. اگر مناطق مداری خطرناک شوند، اثرات می تواند به عنوان کاهش دسترسی به خدمات، پوشش کاهش یافته، زمان های طولانی تر برای ظرفیت جایگزینی، افزایش هزینه ها و ناهنجاری های مکرر عملیاتی افزایش یابد.

برای متخصصان IT، اثر Kessler به عنوان یک خطر سیستمیک برای مجموعه ای از "خدمات پلتفرم" حیاتی که خارج از سیاره زندگی می کنند، شناخته شده است. به همان ترتیب شما یک بحران مسیریابی BGP یا یک وابستگی عمده DNS را نادیده نمی گیرید، نباید لایه فیزیکی فضا را نادیده بگیرید، زمانی که بسیاری از فرآیندهای کسب و کار فرض می کنند که کار خواهند کرد.

فیزیک «خیلی زیاد است»

در مراکز داده، چگالی باعث بهره وری می شود تا زمانی که شکست را ایجاد کند: تعداد زیادی از مستاجران در یک گره پر سر و صدا، بیش از حد بسیاری از آنها در یک shard داغ، بسته های زیادی در یک لینک اشباع شده می نویسند. فضا نسخه مخصوص خود را دارد. اوربیت ها خطوط باز نامحدود نیستند؛ آنها توسط باندهای ارتفاع، تمایلات و نیازهای مأموریت محدود می شوند. برخی از پوسته ها در LEO به ویژه جذاب هستند زیرا آنها تاخیر پایین و پوشش قوی را ارائه می دهند که باعث می شود راه اندازی های بیشتری در همان مناطق انجام شود.

هنگامی که یک منطقه شلوغ می شود، احتمال رویکردهای نزدیک افزایش می یابد. اپراتورهای وابسته به ردیابی شبکه ها و تجزیه و تحلیل پیوند برای پیش بینی برخوردهای بالقوه و اجتناب از انجام مانور. این کار تا یک نقطه انجام می شود، اما دارای محدودیت های مقیاس پذیری است. یک شمارش بالاتر تعداد هشدار های مرتبط را افزایش می دهد. هشدار بیشتر به معنای تصمیم گیری های مانور بیشتر است. مانور بیشتر به معنای استفاده بیشتر از سوخت و عمر ماهواره ای کوتاه تر است. عمر کوتاه تر به معنای راه اندازی جایگزین بیشتر است که می تواند باعث افزایش تراکم بیشتر شود.

این یک حلقه بازخورد کلاسیک است. آستانه “بیش از حد” یک عدد جادویی نیست؛ لحظه ای است که مکانیسم های کاهش ریسک محیط زیست دیگر با رشد ریسک همگام نیستند. در شرایط IT، زمانی است که فشار کمر شما شکست می یابد، صف های شما سریع تر از آن رشد می کنند و سیستم شروع به تقویت شکست خود می کند.

محیط مداری مدرن: صورت فلکی بیشتر، پیچیدگی بیشتر

دهه گذشته شاهد تغییر تعداد نسبتا کمی از ماهواره های با ارزش بالا به صورت فلکی بزرگ ماهواره های کوچکتر، به ویژه در LEO بوده است. این وضعیت عملیاتی را تغییر می دهد. به جای محافظت از چند سیستم فوق العاده، اکوسیستم در حال حاضر ناوگان هایی را مدیریت می کند که انعطاف پذیری از اعداد، جایگزینی سریع و عملیات زمینی پیچیده می آید.

از دیدگاه قابل اطمینان، صورت فلکی می تواند به شکست های فردی قوی باشد. از منظر محیط زیست، آنها شمارش اشیا را افزایش می دهند و شمارش اشیا متغیری است که اثر Kessler به آن حساس تر است. این صنعت به شدت در اجتناب از برخورد، برنامه های deorbit و پیگیری پیشرفت ها سرمایه گذاری می کند، اما روند ماکرو همچنان ادامه دارد: بازیگران بیشتر، راه اندازی بیشتر، ریسک مشترک تر و انگیزه بیشتر برای اشغال پوسته های مداری محبوب.

برای رهبران فناوری اطلاعات، مشاهده کلیدی این است که زنجیره وابستگی شما در حال تبدیل شدن به “ابر مانند” است. بسیاری از خدماتی که مصرف می کنید در بالای زیرساخت های ماهواره ای ساخته شده اند که به طور مستقیم کنترل نمی کنید. این باعث می شود شفافیت و برنامه ریزی انعطاف پذیر ضروری باشد.

حالت های شکست که برای تیم های IT آشنا هستند

اثر Kessler یک آبشار فیزیکی است، اما علائم عملیاتی آن به طور منظم بر روی کلاس های آشنا از حوادث نقشه برداری می شود. تفکر در این الگوها به تیم ها کمک می کند تا کتاب های اجرا و انتظارات کسب و کار را بدون نیاز به تبدیل شدن به مهندسان مداری بسازند.

سناریوی تخریب خدمات محتمل ترین تجربه اولیه است. شما یک خاموش شدن کامل را نمی بینید؛ شما در دسترس بودن متناوب، عملکرد متغیر، افزایش از دست دادن بسته در لینک های خاص و رفتار منطقه ای غیر قابل پیش بینی مشاهده می کنید. این آینه ها نشان می دهد که چگونه crunches در شبکه ها و مناطق ابری ظاهر می شود.

یک سناریو عقب نشینی و ظرفیت به دنبال اگر اپراتورها باید به دلیل ریسک برخورد، یا اگر ماهواره ها به طور غیر منتظره ای گم شوند، بازسازی به زنجیره تامین و مشکل برنامه ریزی تبدیل می شود. ظرفیت راه اندازی، ادغام محموله، هماهنگی قانونی و تولید از طریقput نامحدود نیست. فرض "در مقیاس" شما ممکن است در راه خرید سخت افزار شکست بخورد، زمانی که همه به همان GPU نیاز دارند.

یک سناریوی وابستگی پیچیده جایی است که IT به شدت تاثیر آن را احساس می کند. سیستم های ماهواره ای از backhaul در مکان های دور، شکست اضطراری، اتصال دریایی و زمان بندی پشتیبانی می کنند. اگر این کاهش، شعاع انفجار می تواند به جریان های احراز هویت، نظارت بر خط لوله، همبستگی، سفارش معامله و تحقیقات حادثه برسد.

در نهایت، یک سناریوی اعتماد و صداقت وجود دارد. هنگامی که یک سرویس غیر قابل اعتماد می شود، وسوسه این است که به سرعت آن را دور بیندازید. این می تواند منجر به شکست های ناامن، تغییرات پیکربندی ضعیف، تایید معلول یا استثناهای مسیریابی آگهی شود. بسیاری از حوادث امنیتی بزرگ به عنوان میانبرهای انعطاف پذیر که تحت فشار قرار می گیرند، آغاز می شوند.

تیمینگ: وابستگی آرام بسیاری از تیم ها دست کم می گیرد

زمان دقیق، محاسبات مدرن را بیش از اکثر مردم تایید می کند. گواهینامه ها دارای پنجره های معتبر هستند. Kerberos و بسیاری از روش های احراز هویت به تحمل ساعت متکی هستند. ردیابی توزیع شده و تجزیه و تحلیل log فرض سفارش منسجم. سیستم های مالی و محیط های کنترل صنعتی اغلب نیاز به زمان دقیق برای انطباق و ایمنی دارند.

سیستم های ناوبری ماهواره ای به سیگنال های زمان بندی کمک می کنند که بسیاری از زیرساخت ها به طور مستقیم یا غیرمستقیم استفاده می کنند. حتی اگر زمان مرکز داده های اصلی شما از منابع زمینی باشد، ارائه دهندگان بالادستی، اپراتورهای مخابراتی یا محیط های لبه ممکن است به زمان بندی ماهواره وابسته باشند. هنگامی که خدمات مداری از بین می رود، ممکن است در یک مفهوم سینمایی “ GPS” را از دست ندهید، اما ممکن است شاهد افزایش زمان در مکان هایی باشید که به طور منظم حسابرسی نمی کنید.

برای عملیات IT، انتخاب عملی ساده است: زمان را به عنوان یک خدمت انتقادی با قرمزی و نظارت درمان کنید. منابع NTP را معتبر کنید، ورودی های زمان بندی را در صورت امکان متنوع کنید و اطمینان حاصل کنید که پاسخ حادثه شما می تواند با ناهنجاری های زمانی جزئی مقابله کند. اگر تا به حال سعی کرده اید که با ساعت های مبهم قانونی را انجام دهید، می دانید که چرا این مهم است.

اتصال: هنگامی که "لینک های پشتیبان" تبدیل به خطر اصلی

اتصال ماهواره اغلب به عنوان سقوط انعطاف پذیر برای کاهش فیبر، بلایای طبیعی و عملیات از راه دور قرار می گیرد. این درست است، اما به این معنی است که لینک های ماهواره ای بار خاصی را حمل می کنند: انتظار می رود زمانی که همه چیز شکست می خورد، کار کنند. اگر یک رویداد احتکار مداری در دسترس بودن را کاهش دهد، برنامه عقب نشینی شما ممکن است دقیقا زمانی که به آن نیاز دارید، کاهش یابد.

این همان الگویی است که بر یک منطقه واحد برای بازیابی فاجعه تکیه می کند یا یک مسیر مدیریت گروه را که به آرامی همان دامنه شکست را به عنوان تولید به اشتراک می گذارد، فرض می کند. انعطاف پذیری در مورد داشتن دو لینک نیست، بلکه در مورد داشتن دو لینک است که به طور متفاوتی شکست می خورند.

تیم های IT می توانند این را به تصمیمات معماری ترجمه کنند. اگر backhaul ماهواره بخشی از برنامه تداوم شما است، اسنادی را که خدمات واقعاً به آن نیاز دارند، چه عملکردی را تحت فشار قرار دهید و چه گزینه های شما اگر ظرفیت ماهواره ای محدود شده باشد. در برخی موارد، پاسخ ممکن است ترکیبی از بی سیم زمینی، ارائه دهندگان متعدد، Caching، خودمختاری محلی در لبه، و رفتار برنامه کاربردی ضعیف باشد.

درس های حفظ کننده: شما نمی توانید آنچه را که نمی توانید ببینید را اصلاح کنید

اپراتورهای فضایی در دنیایی از تلهومتر، ردیابی و پیش بینی زندگی می کنند. تیم های IT می توانند ذهنیت را اتخاذ کنند حتی اگر منابع داده متفاوت باشند. اگر سازمان شما به خدمات ماهواره ای وابسته است، قابلیت نگهداری صریح برای این وابستگی ها را اضافه کنید. پیگیری تاخیر، jitter، از دست دادن بسته، رفتار شکست خورده و الگوهای خطا توسط منطقه و زمان روز. مراقب ناهنجاری هایی باشید که با اطلاعیه های خدمات شناخته شده، شرایط ژئومغناطیسی یا پنجره های تعمیر و نگهداری مرتبط هستند.

رایج ترین اشتباه این است که ماهواره را به عنوان یک ISP جعبه سیاه درمان کنیم. این منجر به عیب یابی کم عمق و وضوح حوادث آهسته می شود. یک رویکرد بهتر این است که مسیر ماهواره را به عنوان یک بخش شبکه درجه اول با SLO، داشبورد و کتاب های اجرا خود بسازید. اگر org شما چندین سایت داشته باشد، یک مجموعه داده پایه کوچک ایجاد کنید که نشان می دهد “طبیعی” به نظر می رسد، به طوری که “عجاز اما طبیعی” باعث وحشت نمی شود و “تقسیم دقیق” به نظر نمی رسد.

همچنین جنبه انسانی را در نظر بگیرید. هنگامی که وابستگی از راه دور و ناآشنا است، تیم ها تمایل به پیش بینی در طول حوادث دارند. روش های تکراری، مسیرهای افزایش فروش و آستانه های تصمیم گیری روشن چیزی است که از تبدیل شدن به هرج و مرج جلوگیری می کند.

پیامدهای امنیتی: رویدادهای انعطاف پذیر فرصت های مهاجم را ایجاد می کنند

اثر Kessler یک حمله سایبری نیست، اما می تواند شرایطی را ایجاد کند که مهاجمان از آن بهره برداری می کنند: سردرگمی، نظارت ضعیف، تغییرات سریع و نیاز به بازگرداندن سیستم های پیکربندی مجدد یا مسیریابی سریع. اختلال در اتصال ماهواره ای می تواند دید را به دارایی های دور افتاده کاهش دهد. اگر شما به ماهواره ای برای تله عدم تقارن از سایت های بحرانی وابسته هستید، ممکن است به طور موقت داده هایی را از دست بدهید که به طور معمول به شما هشدار می دهند تا سازش کنید.

همچنین ابعاد زنجیره تامین وجود دارد. هنگامی که ماهواره های جایگزین و تجهیزات زمینی کمیاب یا گران می شوند، سازمان ها ممکن است کنترل های خرید ضعیف تر، فروشنده عجله را قبول کنند یا سیستم عامل های ناشناخته را به کار گیرند. رهبران امنیتی باید این را با سفت کردن پایه ها در حال حاضر پیش بینی کنند، به طوری که فشار آینده میانبرهای خطرناک را تحمیل نمی کند.

در نهایت، برنامه ریزی تداوم باید شامل الگوهای هویت و دسترسی در طول اتصال ضعیف باشد. اگر جریان IAM شما نیاز به دسترسی همیشه به بالادستی داشته باشد، سایت های از راه دور ممکن است به حساب های محلی، اعتبار های مشترک و یا استثنائات سیاست مجبور شوند. این استثناها به بدهی فنی تبدیل می شوند که مهاجمان دوست دارند.

مدیریت و مسئولیت مشترک: فضای مداری یک مشکل مشترک است

اثر Kessler در هسته خود، یک خطر مشترک محیط زیست است. هیچ سازمان واحدی مالک یک پوسته مداری نیست که یک شرکت صاحب یک مرکز داده است. این شبیه به منابع مشترک اینترنت است: فضای آدرس IP، مسیریابی، DNS، اکوسیستم های گواهی و زنجیره های منبع باز. هر کس زمانی که لایه مشترک سالم است، سود می برد و هر کس زمانی که انگیزه ها بدون پاسخگویی بیش از حد استفاده می کنند، رنج می برد.

تلاش های پایداری فضایی شامل ردیابی استانداردها، دستورالعمل های کاهش زباله، شیوه های دفع پس از بهبودی، هماهنگی اجتناب از برخورد و رویکردهای متحرک در حال ظهور است. جزئیات در سراسر مناطق و تنظیم کنندگان متفاوت است، اما جهت روشن است: صنعت تلاش می کند تا "بهترین تلاش" را به هنجارهای قابل اجرا تبدیل کند.

برای متخصصان IT، مدیریت مهم است زیرا بر پیش بینی خدمات تأثیر می گذارد. هنجارهای قوی تر و شفافیت می تواند خطر سیستمیک را کاهش دهد. هنجارهای ضعیف احتمال شکننده شدن وابستگی های شما را در طول زمان افزایش می دهد. حتی اگر شما یک شرکت فضایی نیستید، شما یک مصرف کننده از خدمات فعال فضا هستید و مصرف کنندگان می توانند با درخواست شواهد عملیات مسئول بر بازارها تأثیر بگذارند.

ترجمه ریسک عملی برای برنامه ریزی سازمانی

یک راه مفید برای ترکیب اثر Kessler در ریسک سازمانی این است که آن را مانند یک سناریوی “کم-probability، High-impact، Long-horizon” با پیش سازهای نزدیک به مدت معنی دار درمان کنید. شما نیازی به پیش بینی یک نقطه دقیق ندارید. شما باید درک کنید که چه نوردهی به نظر می رسد و شکننده بودن را کاهش می دهد.

با نقشه برداری وابستگی ها شروع کنید. شناسایی جایی که خدمات ماهواره ای به طور مستقیم مورد استفاده قرار می گیرد: شاخه های دور، لینک های دریایی، واحدهای فرماندهی تلفن همراه، اتصال پشتیبان، استقرار IoT، ارتباطات اضطراری و زمان بندی. سپس وابستگی های غیرمستقیم را از طریق فروشندگان شناسایی کنید: ارائه دهندگان مخابراتی، خدمات ابر، سیستم عامل های تدارکات، ارائه دهندگان نقشه برداری و هر سیستم که فرضیات قابلیت اطمینان آن شامل پوشش جهانی است.

سپس دامنه های شکست خود را ارزیابی کنید. اگر یک لینک ماهواره ای “برنامه B” شما باشد، اطمینان حاصل کنید که برنامه B همان وابستگی های پنهان را به عنوان برنامه A به اشتراک نمی گذارد. اگر زمان بندی مهم است، اطمینان حاصل کنید که Redundancy را کنترل کرده اید. اگر عملیات از راه دور نیاز به اتصال دائمی داشته باشد، استراتژی های خودمختاری لبه را در نظر بگیرید تا تخریب موقت دولت های ناامن ایجاد نکند.

در نهایت، حالت های ضعیف خود را بنویسید. تفاوت بین یک حادثه قابل مدیریت و بحران کسب و کار اغلب این است که آیا سازمان پیش از آن در مورد آنچه که "پیشرفته اما امن" به نظر می رسد، توافق کرده است. این توافق به عمل می آید.

سیستم هایی که عدم اطمینان مداری را تحمل می کنند

اگر برای این فرض طراحی کنید که خدمات مداری کامل خواهد بود، بدترین رفتار خود را به ارث خواهید برد. اگر برای تخریب جزئی طراحی می کنید، اهرمی به دست می آورید. بسیاری از الگوهای همان الگوهایی هستند که شما قبلا برای شبکه های غیر قابل اعتماد و پیوندهای محدود استفاده می کنید.

Caching و اولین طراحی محلی، وابستگی به اتصال مداوم را کاهش می دهد. اگر سایت های دور افتاده بتوانند عملیات هسته ای را به صورت محلی ادامه دهند و بعدا همگام سازی کنند، بی ثباتی لینک ماهواره ای به جای یک عامل خاموش شدن ناراحت می شود. این امر به ویژه برای خدمات میدانی، تدارکات، سایت های صنعتی و هر محیطی که امنیت انسانی یا فرآیندهای فیزیکی حتی زمانی که شبکه ها در آن باقی می مانند، مرتبط است.

ادغام مبتنی بر Queue نیز کمک می کند. به جای جریان های کاری سخت برای پاسخ های سریع بالادستی، از پیام های بادوام و پردازش قابلیت استفاده کنید. به این ترتیب، فلپ های لینک اقدامات تکراری یا حالت متناقض ایجاد نمی کنند.

قابلیت اطمینان باید سازگار باشد. اگر خط لوله تلهومتر شما به همان لینکی که شکست خورده است بستگی دارد، شما نیاز به یک حالت تله متری سبک و یا حفظ محلی با تاخیر صادرات دارید. نکته این است که همه چیز را جمع آوری نکنید، اما برای حفظ حداقل سیگنال هایی که برای ایمنی و تجزیه و تحلیل پس از شناسایی نیاز دارید.

کنترل های امنیتی باید با خیال راحت کاهش یابند. سیاست ها و مکانیسم هایی که در جایی مناسب بسته نمی شوند، اما همچنین از طرح هایی که اپراتورهای را به صندوق های دستی خطرناک سوق می دهند، اجتناب می کنند. این جایی است که تمرینات جدول بالا پرداخت می کنند: آنها نشان می دهند که آیا حالت امن شما در واقع عملیاتی است.

چه چیزی از فروشندگان و ارائه دهندگان بپرسید

بسیاری از تیم های IT نتایج را خریداری می کنند، نه زیرساخت. این خوب است، اما سوالاتی که از شما می پرسند این است که چگونه خطر شما واقعا قابل مشاهده است. هنگامی که خدمات ماهواره ای بخشی از زنجیره ارزش است، مکالمات فروشنده باید شامل بیش از پهنای باند و نقشه های پوشش باشد.

در مورد اقدامات اجتناب از برخورد و هماهنگی عملیاتی سوال کنید. بپرسید چه اتفاقی می افتد زمانی که ماهواره ها از بین می روند: چه ظرفیتی را می توان بازسازی کرد و چه سیاست های اولویت بندی تحت فشار قرار می گیرند. بپرسید که چگونه اطلاعیه های خدمات ارتباط برقرار می کنند و آیا یک API یا تغذیه مناسب برای ادغام NOC وجود دارد.

همچنین درباره زمان بندی وابستگی ها سوال کنید. اگر یک فروشنده خدماتی را ارائه می دهد که به زمان دقیق متکی هستند، بپرسید که چه چیزی وجود دارد و چه نظارت هایی انجام می دهند. اگر آنها ادعا می کنند “پنج نه”، بپرسید که دامنه های شکست از آن SLO حذف شده اند و آیا خطر محیط مداری به طور واضح در نظر گرفته می شود.

لحن در اینجا مهم است. هدف این نیست که فروشندگان را بازجویی کنید، بلکه برای درمان وابستگی مداری با همان بلوغی که قبلاً در مناطق ابری، شبکه های بالادستی و ارائه دهندگان کلیدی SaaS اعمال می کنید.

ذهنیت پاسخ به حوادث: کتاب های اجرا برای آسمان

اثر Kessler یک سناریو استراتژیک است، اما پیشگامان کوچکتر آن می توانند به عنوان حوادث روزمره نشان دهند: تخریب های غیر قابل توضیح، افزایش شکست، ناهنجاری های منطقه ای یا نگهداری طولانی مدت فروشنده. فرآیند پاسخ حادثه شما باید آماده طبقه بندی "نقسیم وابستگی اضطراری" به نحوی باشد که شما مسائل DNS یا حوادث سرویس ابری را طبقه بندی می کنید.

یک درخت تصمیم گیری ساده ایجاد کنید که پاسخ می دهد: چه علائمی مشکلات ماهواره ای را نشان می دهد، چگونه به سرعت تأیید کنیم، چه زمانی شکست بخوریم، چه زمانی برای تر شدن، و چه زمانی به حالت ضعیف حرکت کنید. قالب های ارتباطی را تعریف کنید که تاثیر را در زبان کسب و کار توضیح می دهد، زیرا علت ریشه می تواند عجیب و غریب باشد و سوء تفاهم را دعوت کند.

همچنین برنامه ریزی برای حوادث "بلند دم" یک رویداد مداری بزرگ ممکن است اثرات جانبی داشته باشد که ادامه دارد: تغییر الگوهای اجتناب، تغییر پوشش و محدودیت های ظرفیت. تیم های استرس طولانی به طور متفاوتی نسبت به موارد کوتاه به صورت مسئولانه، یادداشت ها را حفظ کنید و اطمینان حاصل کنید که postmortems بهبود معماری واقعی را به جای پچ های یک بار تولید می کند.

آیا اثر Kessler اجتناب ناپذیر است؟

"غیرقابل انکار" کلمه اشتباهی برای برنامه ریزی فناوری اطلاعات است. سوال درست این است که آیا خطر در حال افزایش است، آیا کاهش به اندازه کافی سریع است و آیا سیستم های شما برای تحمل عدم اطمینان طراحی شده اند. تلاش های صنعت برای بهبود ردیابی، هماهنگی، رعایت deorbit و عملیات پایدار واقعی و در حال رشد است. در عین حال، انگیزه هایی برای استقرار زیرساخت های بیشتر در مدارهای عمومی نیز واقعی هستند.

موضع عملی برای متخصصان IT این است که به عنوان یک متغیر قابلیت اطمینان در حال توسعه، نه یک طرح علمی تخیلی دور، برخورد کنند. مانند بسیاری از ریسک های زیربنایی، می تواند انتزاعی باقی بماند تا زمانی که یک توالی از رویدادهای "rare" به یک پنجره کوتاه فشرده شود و ناگهان به مشکل همه تبدیل شود.

بسته بندی عملی: فضا را مانند یک پلت فرم انتقادی مشترک درمان کنید

اثر Kessler هشدار در مورد تراکم، انگیزه ها و حلقه های بازخورد در یک محیط مشترک است. IT از طریق این داستان زندگی کرده است: مسابقات سلاح های اسپم ایمیل، حوادث BGP، شوک های اکوسیستم گواهی، و ضعف زنجیره تامین منبع باز. هر بار، برنده ها سازمان هایی بودند که فرض می کردند لایه مشترک می تواند برای آن نرم و طراحی شود.

سرویس های فعال فضایی به اندازه کافی بنیادی شده اند که رهبران IT باید آنها را در ثبت ریسک، برنامه های تداوم و بررسی معماری قرار دهند. شما نیازی به پیش بینی آینده زباله های مداری با دقت ندارید. شما باید تنها نقاط شکست را کاهش دهید، وابستگی های خود را نظارت کنید، شفافیت را از ارائه دهندگان بخواهید و اطمینان حاصل کنید که سیستم های شما می توانند در شرایط ضعیف کار کنند.

وقتی خیلی زیاد می شود، به ندرت مانند یک لحظه احساس می شود. به نظر می رسد که افزایش سر و صدای عملیاتی، استثنائات بیشتر، کارهای بیشتر و غافلگیری های بیشتر. قبل از آن شما لایه مداری را به عنوان بخشی از پلت فرم خود درمان می کنید، کمتر احتمال دارد که سازمان شما از آسمان شگفت زده شود.

Latest Articles

Read More...
date dark
hits dark 2919
Read More...
date dark
hits dark 2831