Huawei Cloud introduce CloudMatrix384, AI Token și CloudRobo pentru AI industrială la HUAWEI CONNECT 2025

Huawei Cloud a dezvăluit, la HUAWEI CONNECT 2025 din Shanghai, progrese semnificative în infrastructura și serviciile pentru inteligență artificială, prezentate de Zhang Ping’an, președinte executiv al consiliului de administrație Huawei și CEO Huawei Cloud. Discursul a inclus lansarea supernucleelor CloudMatrix384, a serviciului AI Token, îmbunătățiri ale modelelor Pangu, platforma de AI încorporată CloudRobo, protocoalele pentru comunicația robot-cloud și extinderea serviciilor Kunpeng și GaussDB, toate orientate spre oferirea de putere de calcul, memorie și servicii distribuite pentru diverse scenarii industriale.

De la apariția primelor centre de calcul masive, competiția a măsurat „puterea brută” de procesare. Astăzi contează nu doar câtă putere există, ci și modul în care este interconectată și utilizată eficient. Huawei Cloud a prezentat AI Compute Service construit pe CloudMatrix384, un supernucleu ce scalează de la 384 la 8.192 plăci pe supernucleu și poate fi agregat la nivel de cluster hyperscale între 500.000 și 1.000.000 plăci. Practic, este o platformă pentru antrenare și inferență AI la scară industrială, creată pentru a transforma sarcinile secvențiale în joburi paralele distribuite, ceea ce ridică semnificativ performanța la inferență. Conform testelor comunicate, performanța medie de inferență pe placă a CloudMatrix384 este de trei-patru ori mai mare decât H20 în scenarii cu cerințe variate de latență, de la inferență online la offline.

Pe lângă capacitatea de calcul, Huawei pune accent pe memorie: Elastic Memory Service (EMS) extinde memoria video cu memorie adițională, scăzând latența în conversațiile multi-turn pe modele fundament și îmbunătățind experiența utilizatorilor. De asemenea, Huawei a pus în funcțiune centre de date AI răcite integral cu lichid în provincii chineze precum Guizhou, Mongolia Interioară și Anhui, cu o disipare termică de 80 kW pe rack și un PUE de 1, 1. Acest tip de datacenter, cu mentenanță asistată de AI, oferă companiilor acces rapid la capacități ridicate de calcul fără a reconstrui infrastructura locală; o legătură prin fibră optică le permite acces la servicii cloud dedicate.

Pentru a facilita utilizarea acestor resurse, Huawei Cloud a introdus AI Token Service, o abstracție care livrează direct rezultatele calculului AI, permițând utilizatorilor să folosească resursele de inferență mai eficient. Supernucleul CloudMatrix384 oferă o consolidare completă a resurselor de calcul, memorie și stocare, decuplând sarcinile și optimizând fluxurile de lucru.

În sfera modelelor, Huawei continuă extinderea familiei Pangu, atât în variantă open (openPangu) pentru bune practici de antrenare și inferență, cât și în versiune proprietară. Modelele Pangu au fost adaptate pentru peste 500 de scenarii în mai mult de 30 de industrii, administrație publică, finanțe, producție, sănătate, extracție cărbune, siderurgie, căi ferate, vehicule autonome și meteorologie, și Huawei își propune să sprijine clienții în dezvoltarea de modele specifice industriei, accelerând transformarea inteligentă.

Huawei Cloud extinde inteligența și dincolo de dispozitivele terminale prin CloudRobo, o platformă de Embodied AI care rulează algoritmi avansați în cloud pentru a simplifica procesele locale ale roboților. Externalizarea funcțiilor grele în cloud reduce constrângerile hardware ale roboților și le extinde aplicabilitatea. Pentru o comunicare unificată între roboți și cloud a fost creat protocolul Robot to Cloud (R2C), iar primii 20 de parteneri s-au angajat deja în această inițiativă.

Pe partea software-hardware, serviciile Kunpeng susțin oferta cloud bazată pe ARM, iar numărul de nuclee Kunpeng disponibile pe Huawei Cloud a crescut de la 9 milioane la 15 milioane, o majorare de 67%. Platforma Kunpeng a fost optimizată pentru compatibilitate cu aplicații uzuale, suportând peste 25.000 de aplicații și fiind utilizată în scenarii precum transcodare, baze de date, aplicații web și telefoane cloud.

În zona bazelor de date, GaussDB valorifică supernucleele pentru a implementa o consolidare stratificată a resurselor, permițând citirea și scrierea de pe orice nod în paralel, depășind limitările arhitecturilor tradiționale. Clusterele GaussDB pe supernuclee pot procesa 5, 4 milioane de tranzacții pe minut, aproape de trei ori mai mult decât clusterele fără supernuclee, iar planificarea dinamică a încărcării îmbunătățește performanța în tranzacțiile concurente.

Pentru scenarii distribuite, Huawei Cloud propune portofoliul CloudOcean, CloudSea, CloudLake și CloudPond, menit să asigure o experiență unificată indiferent de locația resurselor, centre centrale, zone cu trafic intens sau margini de rețea, și acces local optimizat. În acest ecosistem a apărut și Versatile, o platformă pentru agenți AI la nivel enterprise, care simplifică dezvoltarea și rularea agenților. Cu Versatile, crearea unui agent poate fi realizată în doar două etape, după încărcarea documentelor ce descriu procesele și organigrama companiei, accelerând implementarea aplicațiilor dedicate.

Evenimentul a inclus forumuri și mese rotunde, în care Huawei Cloud și partenerii au discutat tehnologii și practici în infrastructură cloud, modele mari, baze de date, agenți AI și AI încorporată, demonstrând aplicabilitatea soluțiilor în transformarea digitală a industriilor.

CloudMatrix384 și AI Token se numără printre elementele notabile anunțate la HUAWEI CONNECT 2025; ele evidențiază o direcție clară către consolidarea resurselor de calcul și memorie pentru a deservi diverse scenarii industriale și a facilita dezvoltarea de modele specifice. Gândiți-vă, de pildă, la modelele Pangu utilizate în sectorul financiar sau la CloudRobo care externalizează logica complexă în cloud pentru roboți mai eficienți pe teren. Cum credeți că o astfel de infrastructură ar putea modifica modul în care compania sau sectorul în care activați folosește inteligența artificială?

Fii primul care comentează

Lasă un răspuns

Adresa ta de email nu va fi publicată.


*