AI 세상에 적합한 구축에 대한 시리즈를 계속 이어가면서 AI 배포가 기존 클라우드 또는 엔터프라이즈 배포보다 어떻게 더 밀집되어 있는지, 그리고 데이터센터 설계에서 어떻게 중요한 변화를 주도하고 있는지 살펴보겠습니다. 2011년부터 2020년까지, 즉 AI가 본격화되기 전에는평균 랙 밀도 2.4kW에서 8.4kW로 증가했습니다. 현세대 NVIDIA GPU 아키텍처인 블랙웰은 다음을 위해 설계되었습니다. 랙당 120kW에서 랙당 41kW (호퍼)에서 120kW로 설계되었습니다. 그리고 아키텍처는 계속해서 고밀도화되고 있으며, 지난 3월 NVIDIA의 CEO인 젠슨 황은 2027년 말까지 600kW 랙에 대한 로드맵을 발표했습니다.
AI 모델 학습에 사용되는 GPU는 기존 워크로드에 사용되는 CPU보다 훨씬 더 전력 집약적이기 때문에 AI 배포가 매우 밀집되어 있습니다. 프로세서를 서로 가깝게 배치하면 클러스터 크기가 커지고, 클러스터 크기가 커지면 더 강력한 모델을 구현할 수 있습니다. (자세히 알아보기 위치에 맞게 구축하기.)
이러한 종류의 밀도에서는 AI 배포가 공랭식으로 처리하기에는 너무 많은 열을 발생시키므로 액체 냉각이 필요합니다. 동시에 오늘날 AI를 지원하는 대부분의 데이터센터는 밀도가 훨씬 낮고 공랭식으로 효과적으로 냉각할 수 있는 기존 워크로드도 지원합니다. 따라서 데이터센터는 공랭식과 액체 냉각을 모두 지원할 수 있어야 합니다. AI 개발과 도입이 초기 단계에 있고 앞으로 많은 혁신이 이루어질 것이라는 점을 고려하면 밀도는 계속 높아질 것입니다. 데이터센터는 현재의 밀도를 지원할 수 있어야 하며 미래의 밀도에도 유연하게 대응할 수 있어야 합니다.
밀도 요구 사항에 맞게 구축
AI 데이터센터는 다르게 설계될 뿐만 아니라 다르게 운영됩니다. AI 지원 데이터센터 솔루션 제공은 기술, 구현, 일상적인 실행이 핵심입니다. AI 지원 데이터센터 제품 제공, 독창성는 동급 최고의 경험을 보장하기 위해 업계 최고의 SOP, MOP, EOP를 보유하고 있습니다. 최고 마케팅 및 제품 책임자로서 필립 마랑겔라 에 설명된 기사 는 AI 시대에 맞게 데이터센터 인프라를 조정하는 것에 대해 "공랭식에서 액체 냉각으로 전환하면서 AI/HPC 배포를 위한 안전하고 안전하며 지속 가능한 환경을 보장하기 위해 운영 절차, 교육 및 준비도 완전히 재구성했습니다."라고 설명했습니다.
최신 데이터센터는 고밀도 AI 워크로드와 저밀도 기존 워크로드를 모두 지원해야 합니다. Ingenuity는 10kW에서 500kW 이상의 랙 밀도를 유연하게 지원할 수 있습니다. GPU, CPU, 스토리지 및 네트워킹에 대한 다양한 전력 밀도 및 냉각 요구 사항을 수용하는 Ingenuity는 동일한 데이터센터 내에서 전용 AI 워크로드뿐만 아니라 혼합 워크로드도 지원합니다. 또한 지속적인 냉각 기능을 위해 내장된 열 스토리지를 활용하여 동일한 데이터센터 내에서 다양한 IT 부하의 균형을 맞출 수 있는 유연성을 갖추고 있습니다.
오늘날의 AI 워크로드를 지원하기 위해 구축된 데이터센터는 미래의 AI 워크로드도 지원할 수 있는 유연성을 갖춰야 합니다. NVIDIA DGX 인증 파트너로서 당사는 칩 제조업체와 긴밀히 협력하여 차세대 AI 칩의 전력 및 냉각 요구 사항을 지원할 수 있는 기술 솔루션을 갖추고 있습니다. 회로의 백플레인처럼 유니티의 AI 지원 데이터센터는 AI 배포를 실행할 수 있는 기반 역할을 합니다. 이 설계는 다양한 냉각 기술을 지원할 수 있는 유연성을 갖추고 있으며, AI 아키텍처가 발전함에 따라 비용 효율적인 방식으로 미래의 밀도를 지원할 수 있도록 조정할 수 있습니다.
데이터 센터는 전력 요구 사항이 증가하더라도 지속 가능해야 합니다. AI는 도전과 기회를 동시에 제시합니다. 도전 과제에는 AI와 HPC로 인해 더 높은 전력 밀도가 요구되는 기술적 요건이 포함되며, 기회에는 AI 기술의 빠른 성장과 채택이 포함됩니다. 이러한 도전과 기회에 대응하는 동시에 유니티는 기후 영향 완화를 위해 최선을 다하고 있습니다. 지속 가능성 전략 기후 영향 완화에 전념하고 있습니다. 예를 들어, 고밀도 애플리케이션을 위한 효율적인 냉각 설계는 전력 사용 효율성(PUE)을 최적화하는 데 도움이 됩니다.
결론
AI 워크로드와 관련된 밀도가 급격히 증가함에 따라 데이터센터 설계 방식에 큰 변화가 일어나고 있습니다. 성공하려면 고밀도 AI 워크로드와 저밀도 기존 워크로드, 그리고 AI의 발전에 따른 미래 워크로드를 모두 지원할 수 있을 만큼 유연한 설계를 통해 운영 효율성과 지속 가능성에 전념하는 개발자가 필요합니다. 엣지커넥스와 같은 개발사.
이전에는 인공지능 시대에 맞게 구축하기 시리즈