AWS provoacă un blackout extins pentru aplicațiile populare; Downdetector raportează mai mult de 4 milioane de notificări

În această dimineață, problemele Amazon Web Services (AWS) au afectat numeroase aplicații și site-uri folosite frecvent, însă serviciile Prime ale Amazon au rămas operaționale. Incidentul a perturbat platforme precum Snapchat, Zoom, Duolingo și Peloton, iar rapoartele pe site-urile de monitorizare a întreruperilor au crescut rapid, inclusiv pentru bănci și chiar HMRC din Marea Britanie.

Episodul aduce aminte că, odată cu adoptarea serviciilor cloud, a crescut și dependența centralizată: din cauza unei defecțiuni tehnice la un furnizor major pot fi afectate simultan zeci sau sute de aplicații. În această dimineață, Downdetector a înregistrat peste patru milioane de sesizări la nivel global într-un interval scurt, comparativ cu o medie zilnică de aproximativ 1, 8 milioane. Doar în Regatul Unit au fost raportate peste 400.000 de sesizări în primele două ore ale incidentului. AWS a transmis că se observă semne clare de redresare, că majoritatea cererilor ar trebui acum procesate cu succes și că lucrează pentru a elimina restanțele de solicitări aflate în coadă.

Apariția simultană a unor întreruperi la mai multe servicii nu mai este complet neobișnuită, explică analiștii, pentru că multe companii externalizează stocarea, procesarea și livrarea conținutului către aceiași furnizori de cloud. Efectul este că o problemă localizată în infrastructura unui furnizor poate genera un efect în cascadă, afectând întregul ecosistem de aplicații dependente de acea infrastructură. Disponibilitatea site-ului de cumpărături Amazon și a serviciului Prime Video în această situație arată că impactul poate varia în funcție de configurări, redundanță și zonele rețelei afectate.

Pe scurt, evenimentul reia o lecție tehnică și de management al riscului: dependențele centralizate trebuie compensate prin arhitecturi mai reziliente și prin planuri clare de continuitate. Companiile pot opta pentru soluții multi-cloud, replicare geografică sau mecanisme de fallback pentru a reduce riscul ca o singură defecțiune să le scoată din funcțiune serviciile critice. Pentru utilizatori, astfel de incidente reamintesc că și cele mai mari platforme pot suferi pene temporare, iar comunicarea transparentă din partea furnizorilor rămâne esențială pentru a înțelege amploarea și durata problemelor.

Downdetector a furnizat date concrete: peste 4 milioane de reclamații la nivel mondial în acea dimineață, față de 1, 8 milioane într-o zi lucrătoare obișnuită, și peste 400.000 în Regatul Unit în primele două ore. AWS a anunțat o stabilizare treptată și a menționat că încă gestionează o coadă de cereri restante. Aceste cifre ilustrează cât de rapid se poate amplifica un incident tehnic atunci când numeroase servicii folosesc aceeași infrastructură.

Privind tema mai amplă a dependenței de furnizorii de cloud, exemple precum AWS, Downdetector, Snapchat, Zoom sau HMRC arată că fragilitatea infrastructurilor critice poate avea efecte directe asupra activităților zilnice, de la comunicare la servicii publice. Care crezi că ar fi cea mai eficientă măsură pe care companiile ar trebui să o adopte pentru a diminua riscurile cauzate de astfel de întreruperi?

Fii primul care comentează

Lasă un răspuns

Adresa ta de email nu va fi publicată.


*