AI 모델 연구 위한 필수 시설
수도권 전력 포화로 확충 어려워
냉각 효율전력 공급 개선해야
대학 내 AI 연구가 활발해지며 연산을 처리하는 서버실 격인 AI데이터센터 수요가 늘고 있다. AI 모델에 학습시킬 데이터 용량이 점점 커지면서 전력 소비도 많아지고 있다. 그러나 학교 자체 전력망으로는 전력을 충당하기에 버겁고 외부에서 전력을 추가로 끌어오기도 쉽지 않아 연구에 차질이 생기고 있다. 전문가들은 그래픽처리장치(GPU) 냉각 시스템을 개선하는 기술적인 대책부터 데이터센터 지방 이전이라는 중장기 대책까지 다양한 방안을 제안하고 있다.
GPU 수요만큼 전력 공급 못 해
AI가 공학, 의료 등 특정 분야에 특화된 데이터를 학습하기 위해서는 계산을 빠르게 처리하는 GPU가 필요하다. 기초적인 AI 연구에서는 연구실 GPU 몇 개로 연산을 수행할 수 있지만 다양한 분야에 AI가 접목되면서 GPU 규모를 수백 개까지 키운 AI데이터센터를 따로 마련해야 한다. 박보용(대학원 뇌공학과) 교수는 “CT, MRI, PET 등 뇌 영상을 분석해 얻은 200TB 데이터를 다루려면 수백 개의 GPU가 있어야 한다”며 “데이터 규모가 커지고 인공지능 모델이 복잡해지면서 개인 연구실의 컴퓨팅 자원만으로 원활한 연산이 어렵다”고 말했다.
AI데이터센터는 연산 속도를 높이려 많은 전력을 소비하는 만큼 전력 확보가 어렵다. 냉난방, 전기차 충전 시설 확충 등으로 많은 대학의 자체 전력망도 포화해 GPU 가동에 충분한 전력을 할당할 수도 없다. 일례로 서울대는 교내 전력망을 관리하는 본부가 과부하로 인한 정전을 우려해 전력 사용을 제한하면서 각 연구실의 GPU는 일부만 가동되고 있다.
수도권에 위치한 대학은 전력망 포화로 교외 전력을 공급받기도 어렵다. 김대식 국민의힘 의원실이 한국전력공사로부터 받은 ‘전국 대학 전력 증설 신청 현황’ 자료에 따르면 2022년부터 2024년 1월까지 전국 대학에서 한국전력공사에 고전력 증설을 신청한 18건 중 공급 결정은 3건에 그쳤다. 비수도권 소재 대학은 약 7만 가구가 한 달 동안 사용할 수 있는 150MW도 공급받을 수 있다는 판정을 받았지만 경기도와 서울시 남부 소재 대학은 10MW대의 공급 신청도 승인받지 못했다.
전력 공급이 가능하더라도 전력을 이동시키는 선로 설치비 부담에 대학이 증설 신청을 취소하기도 한다. 같은 자료에 따르면 지난 3년간 대학이 전력 공급 가능 판정을 받고 포기한 사례는 7건이다. 김종원 GIST 슈퍼컴퓨팅센터장은 “10MW를 증설하는 데 수십억 원이 든다”며 “교내 변전 시설을 거쳐 각 건물로 전력을 보내기 위한 공사 비용은 모두 대학이 부담해야 한다”고 밝혔다.
냉각 기술로 전력 절약
전력을 충분히 공급받기 어려운 만큼 AI데이터센터의 서버 냉각 효율을 높여 전력을 절약하는 방안이 검토된다. 고성능 GPU일수록 연산량 증가로 발열이 심해지는데 대다수 AI데이터센터는 프로펠러나 에어컨 등 일반적인 공조에만 의존하고 있다. 국제원자력기구(IAEA)에 따르면 AI데이터센터의 전체 전력의 30%가 GPU 가동 중 발생하는 열을 냉각하는 데 사용된다. 김진섭 한국기계연구원 책임연구원은 “AI데이터센터 내 GPU는 여유 공간 없이 붙어 있어 발열이 심하다”며 “여러 냉각 기술을 도입해 효율을 조금만 개선해도 전력 낭비를 줄일 수 있다”고 말했다. 일례로 컨테인먼트(Containment) 공기 냉각법이 있다. 찬 공기와 뜨거운 공기의 흐름을 분리하고 냉각이 필요한 곳에만 찬 바람을 불어넣는 방식이다. 김 책임연구원은 “100kW 전력으로 구동되는 AI데이터센터에 컨테인먼트 방식을 활용하면 발열로 낭비되는 전력을 국제 평균인 56kW에서 30~40kW로 절감할 수 있다”고 말했다.
규모가 큰 AI데이터센터라면 기체 방식보다 에너지 절감 효과가 큰 액체 냉각 기술도 도입할 수 있다. 김 책임연구원은 “냉각수가 흐르는 판에 GPU를 붙이는 액체 냉각 방식은 56kW의 냉각 전력을 10kW 수준까지 절감할 수 있다”며 “서버 설계 단계부터 고려할 부분이 많아 도입 비용이 많이 들지만 규모가 크면 에너지 절감 효과가 이를 뛰어넘는다”고 말했다.
해외 대학에서는 차가운 바깥 공기를 시설 내부로 들여와 장비를 식히는 프리 쿨링(Free Cooling) 기술도 활용하고 있다. 미국 스탠퍼드대는 특정 기온 이하에서 전체 냉각 시간의 90%를 자연환기 냉각으로 가동한다. 토론토대도 자체 AI데이터센터 냉각의 92%를 외부 공기로 대체해 냉각 전력 비중을 전체의 20% 이하로 설계했다. 김 책임연구원은 “냉각 기술에 쓰이는 별도의 기체액체 압축기가 필요하지 않아 냉각 기술에 드는 전력 소비까지 크게 낮출 수 있다”고 말했다.
지방 이전해 전력 확보해야
기술 활용뿐 아니라 전력 추가 확보가 어려운 수도권을 벗어나 지방으로 AI데이터센터를 옮겨야 한다는 주장도 나온다. 충남경북 등 전력 생산량이 많고 소비량은 적은 지역에 데이터센터를 설치하면 송전망 설치를 두고 발생하는 기업과 주민 간 갈등을 줄이고 전력 잔여량에 맞게 센터 규모를 확충할 수 있다. 김 센터장은 “불필요한 송전 과정 없이 바로 전력을 소비할 수 있는 만큼 국가 전체의 전력망 효율을 높일 수 있다”고 했다.
다만 연구실과 거리가 멀어지면서 연산이 지연되지 않도록 대비해야 하는 과제가 있다. 장길수 고려대 공과대학장은 “평상시 데이터 통신량이 증가하고 연구진이 직접 데이터센터에서 작업해야 하는 일부 상황에는 비효율적일 수 있다”며 “용도에 따라 데이터센터 설치를 이원화하는 방안도 고려해야 한다”고 말했다.
글 | 백하빈 기자 hpaik@
사진 | 최주혜 기자 choi@
인포그래픽 | 주수연 기자 yoyeon@
