ВАНЧО ОРДАНОСКИ
Нема човек на планетава којшто не дозна дека Фејсбук и придружните сервиси Инстаграм и WhatsApp „паднаа“ и не беа достапни 17 часа.
Огромен проблем за компанијата чијшто основен „правач на пари“ се токму тие сајтови. Ако не работи сајтот, не постои ни Фејсбук. ФБ нема продавници, па магацинот ако не работи, сепак нешто ќе „врти“.
Но, поголемиот проблем на ФБ е што вакво нешто воопшто се случи. Ако инфраструктурата ти е основа на бизнисот, таа мора да биде способна да издржи било каков удар.
Со други слични компании (Google, на пример), се има случувано да снема дел од сервисите, и тоа во одредени географски граници, но никогаш 100% и тотално како во овој случај.
Според она што се дозна, Фејсбук ги изгуби „јадрените“ DNS (Domain Name Server), толку темелно, што со авион морало физички да се донесат сис-админи, да се вклучат директно во серверот и да ја оправат работата. Серверите биле во Калифорнија, а администраторите којзнае каде.
Тој „single point of failure“, единствена ранлива точка, е она што треба да го грижи Фејсбук. Тоа е неговиот поголем проблем. Како да се издржи катастрофа, но да се обезбеди брзо и (релативно) лесно враќање на оперативноста.
За чудење е како, една од најголемите и најбогатите светски компании, вредна стотици милијарди долари, да падне на колена така брзо и лесно, и – уште полошо – да не може да се освести после ваков нокаут.
Претпоставувам дека „ќе летаат глави“ во Фејсбук, на оние коишто се одговорни за инфраструктурата.
Стравот е голем дека повторно може да се случи вакво нешто, па акциите на ФБ драматично паднаа во последователните часови.
Решавањето на овој проблем не е ништо ново, се применува откако постојат компјутерски системи. Прво, редундантност (удвојување, па и утројување) на ресурсите, постојана репликација на податоците во реално време, алтернативни напојувања, безбедносни мерки, редовно тренирање на сценарија на опоравување од катастрофата…
На пример, македонските банки (всушност, сите банки во светот), од НБРМ се обврзани да имаат способност во рок од 4 часа од снемувањето, сервисите да бидат реставрирани од алтернативна локација. Таа локација мора да биде на друга тектонска плоча, за да се избегне опасноста земјотрес истовремено да ги погоди примарните и секундарните капацитети.
НБРМ им прави редовни стрес-тестови на македонските банки, за да се увери дека нивните планови за опоравување се во добра состојба.
Инаку, освен македонските банки, би било добро да се истражи колку се подготвени за disaster recovery останатите македонски, особено државни, институции.
Не верувам дека има многу.
На пример, катастрофата со ИТ на последните избори во ДИК е слика на овој проблем.
А замисли, се чуваат критични податоци за граѓани, финансии, здравствени податоци…