Jatkaessamme sarjaamme ”Rakentaminen tarpeiden mukaan tekoälymaailmassa” tarkastellaanpa, miten tekoälyratkaisujen käyttöönotot ovat tiheämpiä kuin perinteiset pilvi- tai yritysratkaisut ja miten ne aiheuttavat merkittäviä muutoksia datakeskusten suunnittelussa. Vuosina 2011–2020 – ennen tekoälyn yleistymistä –keskimääräinen telineiden tiheys 2,4 kW:sta 8,4 kW:iin. Nykyisen sukupolven NVIDIA-GPU-arkkitehtuuri, Blackwell, on suunniteltu 120 kW:iin telinettä kohti, kun se aiemmin oli 41 kW:sta telinettä kohti yhden sukupolven takaisesta (Hopper). Arkkitehtuurit tiivistyvät edelleen; maaliskuussa NVIDIA:n toimitusjohtaja Jensen Huang julkisti suunnitelman 600 kW:n telineiden käyttöönotosta vuoden 2027 loppuun mennessä.
Tekoälyn käyttöönotot ovat niin tiiviitä, koska tekoälymallien kouluttamiseen käytettävät GPU:t kuluttavat huomattavasti enemmän virtaa kuin perinteisiin työkuormiin käytettävät CPU:t. Prosessorien sijoittaminen lähelle toisiaan mahdollistaa suuremmat klusterikoot, ja suuremmat klusterikoot puolestaan mahdollistavat tehokkaammat mallit. (Lue lisää kohdasta Sijaintiin sopiva rakentaminen.)
Tällaisilla tiheyksillä tekoälyn käyttöönotot tuottavat liikaa lämpöä, jotta ilmanjäähdytys riittäisi; ne vaativat nestejäähdytystä. Samalla suurin osa nykyisistä tekoälyä tukevista datakeskuksista tukee myös perinteisiä työkuormia, joiden tiheys on huomattavasti pienempi ja jotka voidaan jäähdyttää tehokkaasti ilmalla. Datakeskusten on siis kyettävä tukemaan sekä ilma- että nestejäähdytystä. Koska tekoälyn kehitys ja käyttöönotto ovat vasta alkuvaiheessa ja innovaatioita on vielä paljon tulossa, tiheydet todennäköisesti kasvavat edelleen. Tietokeskusten on kyettävä tukemaan nykyisiä tiheyksiä ja oltava joustavia, jotta ne pystyvät tukemaan myös tulevia tiheyksiä.
Rakentaminen tiheysvaatimusten mukaisesti
Tekoälykeskuksen suunnittelu ei ole ainoastaan erilainen, vaan myös sen toiminta eroaa muista. Tekoälypohjaisen datakeskusratkaisun toimittaminen on kiinni tekniikasta, käyttöönotosta ja päivittäisestä käytöstä. Tekoälypohjainen datakeskusvalikoimamme, Nerokkuus, noudattaa alan johtavia vakiomenettelyohjeita (SOP), operatiivisia menettelyohjeita (MOP) ja poikkeustilanneohjeita (EOP) varmistaakseen ensiluokkaisen asiakaskokemuksen. Markkinointi- ja tuotejohtajanamme Phillip Marangella selitetty artikkeli tietokeskuksen infrastruktuurin mukauttamisesta tekoälyn aikakaudelle: ”Siirtyessämme ilmanjäähdytyksestä nestejäähdytykseen olemme myös uudistaneet täysin toimintamenettelyjämme, koulutustamme ja valmiuttamme varmistaaksemme turvallisen, suojatun ja kestävän ympäristön tekoäly- ja HPC-ratkaisuille.”
Nykyaikaisen datakeskuksen on tuettava sekä tiheästi pakattuja tekoälytyökuormia että harvemmin pakattuja perinteisiä työkuormia. Ingenuity on joustava ratkaisu, joka tukee 10 kW:n ja yli 500 kW:n välisiä telineiden tiheyksiä. Ingenuity mukautuu GPU:n, CPU:n, tallennustilan ja verkkojen erilaisiin tehotiheys- ja jäähdytysvaatimuksiin ja tukee sekä erillisiä tekoälytyökuormia että sekatyökuormia samassa datakeskuksessa. Meillä on joustavuus tasapainottaa vaihtelevia IT-kuormia samassa datahallissa hyödyntämällä sisäänrakennettua lämpövarastointia jatkuvaan jäähdytykseen.
Nykyisiä tekoälytyökuormia varten rakennettujen datakeskusten on oltava joustavia, jotta ne pystyvät tukemaan myös tulevia tekoälytyökuormia. NVIDIA DGX -sertifioituna kumppanina teemme tiivistä yhteistyötä siruvalmistajan kanssa varmistaaksemme, että meillä on käytettävissä tekniset ratkaisut, jotka tukevat tulevien sukupolvien tekoälysirujen teho- ja jäähdytysvaatimuksia. Kuten piirilevyjen takapaneeli, tekoälyvalmiit datakeskuksemme toimivat perustana, jolla tekoälyratkaisut voivat toimia. Suunnittelu on joustavaa, jotta se tukee erilaisia jäähdytysteknologioita, ja mukautuvaa, jotta se tukee tulevia tiheyksiä kustannustehokkaasti tekoälyarkkitehtuurien kehittyessä.
Tietokeskusten on oltava kestäviä, vaikka niiden energiantarve kasvaisikin. Tekoäly tuo mukanaan sekä haasteita että mahdollisuuksia. Haasteisiin kuuluvat tekoälyn ja HPC:n aiheuttamat korkeamman tehotiheyden teknologiset vaatimukset; mahdollisuuksiin kuuluu tekoälyteknologioiden nopea kasvu ja käyttöönotto. Kun vastaamme näihin haasteisiin ja mahdollisuuksiin, olemme edelleen sitoutuneita lieventämään ilmastovaikutuksia kestävän kehityksen strategiamme avulla sekä lyhyellä että pitkällä aikavälillä. Esimerkiksi tehokkaat jäähdytysratkaisumme tiheille sovelluksille auttavat optimoimaan energiankäytön tehokkuutta (PUE).
Yhteenveto
Tekoälytyökuormien myötä nopeasti kasvavat tiheydet aiheuttavat merkittäviä muutoksia datakeskusten suunnittelussa. Menestys edellyttää kehittäjää, joka on sitoutunut toiminnalliseen huippuosaamiseen ja kestävyyteen ja jonka suunnittelu on riittävän joustavaa tukemaan sekä tiheästi pakattuja tekoälytyökuormia että harvemmin pakattuja perinteisiä työkuormia – sekä tulevia työkuormia tekoälyn kehittyessä. Tällainen kehittäjä on esimerkiksi EdgeConneX.
Aiemmin sarjassa Rakentaminen tekoälymaailmaan -sarjassa: