축구장 5개 규모·수전 용량 40MW
【투데이신문 최주원 기자】 KT클라우드가 그래픽처리장치(GPU)의 고열 문제를 해결하기 위해 액체냉각 방식을 도입한 ‘인공지능(AI) 데이터센터’를 가동했다. 국내 상업용 데이터센터 중 액체냉각을 적용한 첫 사례다.
KT클라우드는 6일 서울 가산에 액체냉각 방식을 도입한 ‘AI 데이터센터’를 공식 개소했다고 밝혔다. 가산 AI 데이터센터는 축구장 약 5개 규모의 지하 5층·지상 10층 구조로 총 수전 용량 40메가와트(㎿), IT 용량 26㎿를 갖췄다.
AI 연산에 적합하도록 서버를 고밀도로 배치할 수 있는 전용 공간을 설계했으며 전력 공급과 통신 연결을 이중화해 안전성을 높였다. 수도권 내 8개 데이터센터를 연결하는 100기가(G)급 ‘원(One) 데이터센터’ 네트워크를 통해 센터 간 초고속 데이터 연동도 가능하다.
일반 데이터센터는 중앙처리장치(CPU) 기반 서버 중심으로 구성돼 랙당 전력 밀도가 평균 2~12㎾ 수준이다. 발열도 낮아 공기 냉각만으로 운영이 가능하다.
반면 AI 데이터센터는 대규모 AI 학습과 추론을 위해 GPU 같은 고성능 연산 장비가 대량 배치된다. 이에 따라 랙당 20~30㎾ 이상의 고전력 설계가 필요하고 고밀도 전력 소모로 인한 발열을 제어하기 위해 액체냉각 같은 첨단 기술 도입이 요구된다.
가산 AI 데이터센터에 적용된 액체냉각 기술은 GPU 칩에 콜드 플레이트를 부착하고 냉수를 직접 접촉시키는 D2C(직접 칩 냉각) 방식이다. KT클라우드는 B200 등 최신 GPU 기반 AI 서버의 고열 환경을 테스트하기 위해 ‘리퀴드 쿨링 부하기’를 자체 개발해 성능 검증을 완료했다.
KT클라우드 최지웅 대표는 “국내에서 시도되지 않았던 액체냉각 방식을 실제 운영 환경에 적용했다”며 “특허 3건을 새로 출원하는 등 데이터센터를 효율적으로 운영하는 노하우를 축적하고 있다”고 설명했다.
KT클라우드는 가산 AI 데이터센터를 통해 ‘콜로닷AI(Colo.AI)’ 서비스도 본격 제공한다. 고객 맞춤형 GPU 서버, 전용 네트워크, 운영 플랫폼, 유지보수를 모두 포함한 통합 턴키(Turnkey) AI 인프라 서비스로 월 단위 구독 방식으로 초기 투자 부담을 낮췄다.
이와 함께 전력 계통을 실시간 감시하고 이상 발생 시 자동으로 전원을 차단·복구하는 ‘패스 파인더(Path Finder)’ 솔루션과 AI 기반으로 장애를 예측하고 문제 상황을 자동 분류하는 ‘자동화 운영 플랫폼(DIMS)’도 적용했다.
최 대표는 “가산 AI 데이터센터는 국내 AI 산업 생태계를 활성화하는 전환점이 될 것”이라며 “중장기적으로 서부권역을 포함한 국내 주요 거점에 500㎿ 이상 규모의 인프라를 확보해 AI 대전환을 선도하겠다”고 말했다.
관련기사
주요기획: 4·10 총선 청년 공약 짚어보기, 新테크노크라시, 2025 게임 청사진
좌우명: Respect 다른기사 보기
