Үндсэн санаанууд
- Facebook-ийн техникийн асуудал харамсалтай байсан ч хэрэв энэ нь хоорондоо холбогдсон олон системд тулгуурлаагүй бол асуудал илүү хурдан шийдэгдэх байсан.
- Системийн доголдлоос бүрэн урьдчилан сэргийлэх арга байхгүй, гэхдээ тэдгээрийг багасгах арга зам бий.
- Систем бүтэлгүйтсэн үед (хэрэв, хэзээ биш) нөөц төлөвлөгөөтэй байх нь "ядаргаатай" болон "гамшгийн" хоорондох ялгааг бий болгож чадна.
Сүүлийн үеийн Фэйсбүүк эвдрэл нь хоорондоо холбогдсон системүүд хэрхэн бүтэлгүйтэх нь гарцаагүй бөгөөд бид яагаад тэдгээрийг бүх зүйлд ашиглах ёсгүйг харуулж байна.
Даваа гаригт Facebook, WhatsApp, Instagram-аа хэдэн цагийн турш алдах нь тохиромжгүй, бизнест хохирол учруулж, зарим тохиолдолд бараг сүйрлийн үр дагаварт хүргэсэн. Facebook-ийн мэдээлснээр энэ нь сүлжээний зохицуулагч чиглүүлэгчийн тохиргооны өөрчлөлтөөс үүдэлтэй.
Энэ бол боломжийн тайлбар боловч үүнтэй төстэй алдаа нь зөвхөн Facebook-ийг төдийгүй Facebook-ийн эзэмшдэг бусад системийг зогсоож болзошгүй нь бага зэрэг түгшүүр төрүүлж байна.
Рутерийн тохиргооны нэг буруу өөрчлөлт нь олон үйлчилгээ, тэр байтугай VR чихэвч хүртэл ажиллахаа больсон. Дээрээс нь Facebook-ийн өөрийнх нь хүлээн зөвшөөрснөөр энэ нь компанийн дата төвүүд хэрхэн харилцахад шаталсан нөлөө үзүүлж, бүх үйлчилгээгээ зогсоосон.
"Холбоотой системд найдах нь систем, тэр ч байтугай үйлчилгээний доголдлоос үүсэх эрсдэлийг дагуулдаг" гэж GlobalDots компанийн борлуулалтын ахлах инженер Франческо Алтомаре Lifewire-д өгсөн цахим шуудангаар ярилцлага өгөхдөө хэлсэн
"Энэ аймшигт эрсдэлтэй тэмцэхийн тулд компаниуд SRE (Системийн найдвартай байдлын инженерчлэл) зарчмыг, түүнчлэн системийн дэд бүтцийн давхарга бүрт өөр өөр түвшний илүүдэлтэй ажиллах бусад хэрэгслийг ашигладаг."
Юу нь буруу болж болох вэ
Иймэрхүү систем бүтэлгүйтсэн тохиолдолд аливаа зүйл буруу болж хувирах төгс шуургыг шаарддаг гэдгийг тэмдэглэх нь зүйтэй. Энэ нь унахыг хүлээж буй хөзрийн байшин шиг биш, харин жижиг сарны хэмжээтэй сансрын станцын ил гарсан дулааны яндангийн порттой адил юм.
Ихэнх компаниуд бүх зүйлийг эмх замбараагүй байдалд хүргэж болзошгүй нэг зүйл хэзээ ч болохгүй, гэхдээ энэ нь тохиолдож болно гэсэн арга хэмжээ авдаг.
"Гэнэтийн бүтэлгүйтэл нь бизнесийн нэг хэсэг бөгөөд ажилчдын хайхрамжгүй байдал, интернет үйлчилгээ үзүүлэгчийн сүлжээний доголдол, тэр ч байтугай үүлэн хадгалах үйлчилгээнд асуудал үүссэний үр дүнд үүсч болно" гэж FastPeopleSearch-ийг үүсгэн байгуулагч Салли Стивенс хэлэв. имэйл ярилцлага.
"…Нөөцлөлт, газар дээрх чиглүүлэгч, шаталсан хандалт зэрэг системийг хамгаалахад шаардлагатай алхмуудыг хийж байгаа цагт эдгээр алдаа гарах магадлал бараг байхгүй." Хэдийгээр эвдрэлээс хамгаалах армитай байсан ч линчпин бүтэлгүйтэх боломжтой хэвээр байна.
Холбоо барих үндсэн хэлбэр, цахилгаан хэрэгсэл, хаалга гэх мэт зүйлсийг хянадаг систем бүтэлгүйтвэл үр дүн нь мэдэгдэхүйц байх болно. Хувь хүмүүс болон компаниуд үүнд хэр их найдаж байгаагаас шалтгаалж бага зэргийн таагүй байдлаас эхлээд бүрэн сүйрэл хүртэл.
"Мөн хакерууд хөргөгч, шарах шарагч зэрэг хамгийн бага хамгаалалттай төхөөрөмжөөс системд нэвтрэх эрсдэлтэй" гэж Стивенс нэмж хэлэв. Энэ нь өгөгдөл хулгайлж, золиослоход хүргэж болзошгүй юм."
Бид хэрхэн бэлдэх вэ
Систем хэзээ ч бүтэлгүйтэхгүй гэдгийг баталгаажуулах арга байхгүй ч алдаа гарах магадлалыг бууруулах эсвэл алдааг илүү хялбар шийдвэрлэхийн тулд хийж болох алхмууд байдаг. Гэнэтийн аюулаас хамгаалах болон эсрэг арга хэмжээнүүдийг гэнэтийн төлөвлөгөө, нөөцлөх системтэй хослуулсан хоёр аргыг хослуулах нь хамгийн тохиромжтой.
"Үр дүнтэй зохицуулагддаг гуравдагч этгээдийн бүтээгдэхүүн, үйлчилгээнээс үүдэлтэй эдгээр аюулыг арилгахын тулд Гуравдагч этгээдийн эрсдэлийн менежменттэй холбоотой үүрэг, үүргийг нарийн тодорхойлсон байх ёстой" гэж FindPeopleFast-ын үүсгэн байгуулагч, технологийн ахлах ажилтан Даниэла Сойер хэлэв. и-мэйл ярилцлагадаа "Эдгээр шинэ орчинд цэцэглэн хөгжихийн тулд эрсдэлийн менежерүүд ийм боловсронгуй экосистемийн чухал хэсгүүдийг ойлгох ёстой."
Фэйсбүүк, WhatsApp, Instagram-д тохиолдсон үйл явдал харамсалтай байсан ч нүдийг нь нээж өгсөн гэж найдаж байна. Харилцан уялдаатай системд тулгуурладаг хүмүүс зөв буруу зүйл нь бүх зүйлийг тасалдуулж чадна гэдгийг ойлгох ёстой. Мөн ийм тасалдал гарах магадлал багатай, нөлөөлөл багатай болгохын тулд арга хэмжээ авах (эсвэл нарийн шалгаж, боловсронгуй болгох) шаардлагатай.
Facebook-ийн хувьд түүний асуудал нь чиглүүлэгчийн асуудал биш, харин бараг бүх экосистемээ бусад бүх зүйлтэй холбосон байсан. Тиймээс Facebook (үйлчилгээ) зогссон тул Facebook (компани) асуудлыг зүгээр л зохион байгуулж, шийдвэрлэхэд илүү их цаг хугацаа, эрч хүч зарцуулах шаардлагатай болсон. Хэрэв энэ нь ийм гүн үндэстэй, харилцан уялдаатай систем ашиглаагүй эсвэл ийм тасалдлыг шийдвэрлэх нөөц төлөвлөгөөгүй байсан бол үүнийг засахад хамаагүй бага хугацаа шаардагдах байсан.