Mens vi fortsetter serien vår om å bygge som passer til en AI-verden , la oss utforske hvordan AI-implementeringer er tettere enn tradisjonelle sky- eller bedriftsimplementeringer, og hvordan de driver betydelige endringer i datasenterdesign. Mellom 2011 og 2020 – før AI tok av – økte gjennomsnittlig racktetthet fra 2,4 kW til 8,4 kW. Den nåværende generasjonen NVIDIA GPU-arkitektur, Blackwell, er designet for 120 kW per rack , opp fra 41 kW per rack for én generasjon siden (Hopper). Og arkitekturene fortsetter å fortettes; i mars annonserte NVIDIA-sjef Jensen Huang en veikart for 600 kW-racker innen utgangen av 2027.
AI-implementeringer er så tette fordi GPU-ene som brukes til å trene AI-modeller er mye mer strømkrevende enn CPU-ene som brukes til tradisjonelle arbeidsbelastninger. Å holde prosessorene tett sammen muliggjør større klyngestørrelser, og større klyngestørrelser muliggjør kraftigere modeller. (Finn ut mer i Bygge som passer til plassering .)
Ved slike tettheter genererer AI-implementeringer for mye varme til at luftkjøling kan håndtere dem; de trenger væskekjøling. Samtidig støtter de fleste datasentre som støtter AI i dag også tradisjonelle arbeidsbelastninger, som er mye mindre tette og kan kjøles effektivt med luft. Så datasentre må kunne støtte både luft- og væskekjøling. Gitt at AI-utvikling og -adopsjon er i de aller tidlige dagene, med mye innovasjon i vente, vil tetthetene sannsynligvis fortsette å øke. Datasentre må kunne støtte dagens tettheter og være fleksible for å støtte fremtidige tettheter også.
Bygging som passer tetthetskrav
Et AI-datasenter er ikke bare designet annerledes; det drives annerledes. Å levere en AI-aktivert datasenterløsning handler om teknologi, implementering og den daglige utførelsen. Vårt AI-aktiverte datasenterprodukttilbud, Oppfinnsomhet, har bransjeledende standardoperasjoner (SOP-er), løpeprosesser (MOP-er) og lønnsprosesser (EOP-er) for å sikre en førsteklasses opplevelse. Som vår markeds- og produktsjef Phillip Marangella forklart i en artikkel om å tilpasse datasenterinfrastrukturen til AI-alderen: «Når vi går over fra luft- til væskekjøling, har vi også fullstendig omkonfigurert våre driftsprosedyrer, opplæring og beredskap for å sikre et trygt, sikkert og bærekraftig miljø for AI/HPC-distribusjoner.»
Et moderne datasenter må støtte både AI-arbeidsbelastninger med høy tetthet og tradisjonelle arbeidsbelastninger med lavere tetthet. Ingenuity er fleksibelt for å støtte racktettheter fra 10 kW til over 500 kW. Ingenuity imøtekommer en rekke krav til effekttetthet og kjøling for GPU, CPU, lagring og nettverk, og støtter dedikerte AI-arbeidsbelastninger samt blandede arbeidsbelastninger, alt innenfor samme datasenter. Vi har fleksibiliteten til å balansere varierende IT-belastninger innenfor samme datahall, og utnytter innebygd termisk lagring for kontinuerlig kjøling.
Datasentre bygget for å støtte dagens AI-arbeidsbelastninger må også være fleksible for å støtte fremtidige AI-arbeidsbelastninger. Som en NVIDIA DGX-sertifisert partner jobber vi tett med brikkeprodusenten for å sikre at vi har de tekniske løsningene på plass for å støtte strøm- og kjølekravene for fremtidige generasjoner av AI-brikker. Som et bakplan i kretser fungerer vårt AI-aktiverte datasenter som et fundament som AI-distribusjoner kan kjøre på. Designet er fleksibelt for å støtte en rekke kjøleteknologier og kan tilpasses for å støtte fremtidige tettheter på en kostnadseffektiv måte etter hvert som AI-arkitekturer utvikler seg.
Datasentre må være bærekraftige, selv om strømbehovet øker. KI presenterer både utfordringer og muligheter. Utfordringene inkluderer de teknologiske kravene til høyere effekttetthetsbehov på grunn av KI og HPC; mulighetene inkluderer den raske veksten og bruken av KI-teknologier. Etter hvert som vi tar tak i disse utfordringene og mulighetene, er vi fortsatt dedikert til å redusere klimapåvirkningen gjennom vår bærekraftsstrategi på både kort og lang sikt. For eksempel bidrar våre effektive kjøledesign for applikasjoner med høy tetthet til å optimalisere strømforbrukseffektiviteten (PUE).
Konklusjon
De raskt økende tetthetene knyttet til AI-arbeidsmengder driver betydelige endringer i hvordan datasentre utformes. Suksess krever en utvikler som er forpliktet til driftsmessig fortreffelighet og bærekraft, med et design som er fleksibelt nok til å støtte både AI-arbeidsmengder med høy tetthet og tradisjonelle arbeidsmengder med lavere tetthet – og fremtidige arbeidsmengder etter hvert som AI utvikler seg. En utvikler som EdgeConneX.
Tidligere i Byggingen som passer til en AI World Series: