Microsoft: o întrerupere a portalului Defender XDR blochează afișarea alertelor threat hunting și a listei de dispozitive

Microsoft se confruntă cu o întrerupere care afectează accesul la anumite funcționalități ale portalului Defender XDR, problemă semnalată din centrul de administrare al serviciului. Din primele ore ale dimineții, operatorii și administratorii au remarcat blocaje care împiedică afișarea unor alerte avansate de tip threat hunting și dispariția unor dispozitive din consolă, situații similare altor pene în cloud când un trafic neașteptat suprasolicită resursele platformelor mari.

Alertul din admin center, cu codul DZ1191468, arată că incidentul a fost cauzat de un vârf de trafic care a dus la creșterea accentuată a utilizării CPU pe componentele care gestionează funcționalitățile portalului Microsoft Defender. Microsoft a recunoscut incidentul în jurul orei 06:10 UTC și i-a acordat statutul de incident, termen folosit pentru probleme critice cu impact vizibil asupra utilizatorilor. Măsurile tehnice au inclus aplicarea unor soluții de atenuare și majorarea capacității de procesare; în actualizarea publicată la 08:00 UTC compania a raportat că telemetria indică recuperare pentru unii clienți. Pe scurt: unele conturi au revenit la normal, altele mai sunt afectate.

În cadrul anchetei, Microsoft analizează urme de trafic în format HTTP Archive (HAR) primite de la clienții afectați. Fișierele HAR conțin capturi ale cererilor și răspunsurilor HTTP, utile pentru a înțelege ce etape au eșuat în schimbul de date dintre browser sau client și serviciu. Pe lângă blocarea accesului, portofoliul de probleme raportate include alerte de threat hunting care nu se afișează și dispozitive care lipsesc din consolă. Compania a confirmat că mai multe organizații au anunțat rezolvarea problemei pentru ele și că monitorizarea arată valori ale utilizării CPU în limite normale pentru majoritatea mediilor. Rămâne însă un număr restrâns de organizații care mai raportează probleme; pentru acestea Microsoft coordonează colectarea de diagnostice suplimentare la nivel de client și de urme HAR pentru a sprijini investigația.

Incidentul este în curs de investigare, iar Microsoft oferă actualizări pe măsură ce apar noi informații. Deși impactul nu a fost uniform pentru toate organizațiile, situația subliniază importanța unei telemetrii clare și a unor mecanisme eficiente de diagnostic, fără date precise, repararea unei probleme complexe într-un mediu distribuit devine dificilă. Un zâmbet mic: când serverele cer mai mult CPU, nu e vorba de cafea, ci de intervenție rapidă.

Alertul DZ1191468 evidențiază că un vârf de trafic poate afecta funcții concrete, precum alertele de threat hunting și lista de dispozitive din portal. Telemetria, fișierele HAR și o comunicare clară cu clienții au fost instrumentele care au contat în gestionarea acestui incident. Cum vă pregătiți organizațiile pentru astfel de situații?

Fii primul care comentează

Lasă un răspuns

Adresa ta de email nu va fi publicată.


*