OCP anunță o inițiativă care se concentrează pe centrele de date pentru AI și pe problemele lor fizice, în California. Istoria standardizării în tehnologie arată că atunci când jucătorii majori împărtășesc specificații și bune practici, inovația se răspândește mai rapid, gândiți-vă la modul în care USB sau standardele pentru rack-uri au simplificat viața pentru toți. Acum, Open Compute Project Foundation (OCP), organizația non-profit recunoscută pentru promovarea practicilor hyperscale, își extinde activitatea printr-un nou Strategic Initiative numit Open Data Center for AI, axat pe infrastructura fizică a centrelor de date: alimentare, răcire, mecanică și telemetrie de management.
OCP avusese deja inițiativa Open Systems for AI, însă creșterea proiectelor legate de infrastructura fizică în ultimele 12 luni, discuțiile din workshop-urile OCP și o scrisoare deschisă lansată de Google, Meta și Microsoft au condus la inițierea acestui SI. Consiliul OCP și părțile interesate susțin extinderea și încurajează alte organizații să semneze scrisoarea, pentru a colabora la un ecosistem deschis care acoperă nu doar componentele IT, ci și facilitățile fizice ale centrelor de date.
Misiunea inițiativei este elaborarea de standarde care să permită instalarea infrastructurii AI dense la fel de flexibilă precum cea a computerelor tradiționale, astfel încât facilitățile să fie construite pe baze comune de telemetrie, soluții avansate de alimentare și tehnologii de răcire. Problema actuală este fragmentarea: proiecte izolate generează cerințe contradictorii, încetinesc inovația și prelungește timpii de implementare. Ținta OCP este identificarea și specificarea cerințelor comune astfel încât infrastructura fizică să asigure fungibilitatea componentelor IT diverse și în permanentă schimbare, facilitând furnizorilor de colocare să deservească mai mulți clienți cu mai puține personalizări.
Inițiativa se sprijină pe proiecte deja active în comunitatea OCP. Un proiect de Coolant Distribution Unit (CDU) urmărește integrarea sistemelor de răcire ale facilităților și a instalațiilor de apă cu răcirea lichidă din sertarele rackurilor IT. Un alt demers la nivel de facilități vizează arhitecturi de distribuție a energiei în curent continuu (DC) pentru a susține rackuri IT cu puteri mari. Aceste inițiative nu sunt doar teoretice: vin cu specificații concrete și obiective de performanță.
Din contribuțiile recente, specificația Diablo, propusă de Google, Meta și Microsoft, descrie un rack de alimentare separat, un fel de sidecar electric, care transformă livrarea energiei din 48 VDC în rack către +/-400 VDC sau 800 VDC. Diablo permite alimentarea rackurilor AI foarte dense, între 100 kW și 1 MW. Alegerea de 400 VDC profită de lanțul de aprovizionare și componentele dezvoltate pentru vehicule electrice, aducând avantaje în scalare economică, calitate dovedită și fabricație eficientă, prin standardizarea interfețelor electrice și mecanice.
Specificația Deschutes CDU este proiectată pentru a susține încărcări termice de aproximativ 2 MW, având o capacitate hidraulică indicativă de 500 GPM la 80–90 psi, ceea ce o situează printre cele mai mari CDU-uri din industrie. Această specificație vizează nu doar performanța termică, ci și posibilitatea implementării de către orice furnizor de CDU: este construită din componente uzuale din industrie, permițând mai multor companii să producă și să îmbunătățească designul. Procedurile de instalare și întreținere sunt standardizate pentru a facilita implementări rapide și echipamente fiabile.
Specificația Clemente descrie un tray de calcul de 1RU care integrează două module gazdă NVIDIA GB300, cu periferice adaptate nevoilor de antrenare și inferență AI/ML ale Meta. Servește și ca model pentru utilizarea unui design care folosește OCP ORv3 HPR (în curs de contribuție) împreună cu rackuri de alimentare sidecar. Platforma include componente răcite atât cu aer, cât și cu lichid: CPU, GPU și switch-uri vor fi răcite cu lichid, iar restul componentelor cu aer.
Toate aceste eforturi consolidează poziția OCP ca o organizație deschisă care accelerează implementarea centrelor de date pentru AI. OCP a centralizat aceste resurse pe un portal AI în OCP Marketplace, astfel încât proiectanții de clustere AI, constructorii și furnizorii de facilități să găsească produse și materiale de referință într-un singur loc. Observațiile analistului Alan Weckel de la 650 Group evidențiază riscul fragmentării pieței și costurile potențiale; el consideră că este momentul potrivit pentru o organizație precum OCP care facilitează identificarea elementelor comune între facilități și infrastructura IT, pentru a accelera viitoarele generații de clustere AI și construirea centrelor de date.
OCP, ca entitate, reunește practici hyperscale pentru a le face accesibile tuturor, acoperind domenii de la silicon la sisteme și la facilități. Comunitatea include operatori hyperscale și cloud, furnizori de comunicații, centre de colocare, companii diverse și furnizori de tehnologie, iar principiile de bază rămân deschidere, eficiență, scală și sustenabilitate. Informații suplimentare și resurse sunt disponibile pe site-ul OCP.
Open Data Center for AI SI, Diablo, Deschutes și Clemente sunt exemple concrete de specificații și proiecte care pot diminua fragmentarea infrastructurii AI și pot accelera implementările practice în centrele de date. Ele oferă date precise: Diablo pentru 100 kW–1 MW la 400 VDC sau 800 VDC, Deschutes pentru ~2 MW termic și 500 GPM hidraulic, Clemente pentru integrarea a două NVIDIA GB300 în 1RU. Aceste specificații pot schimba modul în care furnizorii de colocare și operatorii proiectează facilitățile, reducând personalizările și scurtând timpii de implementare. Ce efect crezi că va avea trecerea la 400 VDC sau la CDU-uri cu astfel de capacități asupra costurilor și asupra ritmului de adoptare a clusterelor AI?
Fii primul care comentează