AI 모델 학습에 필요한 'GPU-FAT 노드' 20대가 '필수 조건'에서 '재량 조건'으로 완화, ▴'파일럿 시스템' 요구 성능 절반으로 줄이고, ▴시스템 유지·보수 인력도 감축
이정문 의원, "챗GPT 등 AI 열풍에 따른 GPU 수요 폭등으로 당초 예산으로는 계획된 성능의 슈퍼컴퓨터 도입 난망, 설상가상 환율 상승으로 원화 도입 가격도 상승"

연구 현장의 거대 계산, 데이터 분석, 인공지능 활용 지원을 위해 최대 600PF(페타플롭스) 처리 속도를 가진 '슈퍼컴퓨터 6호기' 구축 사업이 GPU(그래픽처리장치) 수요 폭등과 환율 상승으로 인해 정상 추진이 불투명한 상황이다

국회 과방위원회 이정문 의원(더불어민주당, 충남 천안병)이 한국과학기술정보연구원(KISTI), 조달청 제출 자료를 분석한 결과, '슈퍼컴퓨터 6호기 시스템 구축 사업' 3차 공고('23.9.14~10.26)의 요구성능과 조건이 2차 공고('23.7.27~8.8) 때 보다 대폭 완화된 것으로 나타났다.

먼저 당초 슈퍼컴퓨터 6호기의 메인 시스템 중 하나로 도입하기로 계획했던 'GPU Fat 노드*' 20대 도입 조건을 ①'필수 의무사항(Mandatory Requirement)'에서 '희망 요구사항(Desirable Requirement)'으로 바꾸고, ②배점도 최소 20대를 도입해야 기본점수(1.6점)을 받는 것에서(70대 이상 도입시 최대 점수 2점), 1대만 도입해도 기본점수를 받는 조건(20대 도입시 최대점수 2점)  으로 대폭 완화되었다.

* GPU Fat 노드 : 병렬화된 GPU를 8개 이상 장착한 개별 OS 서버. 생성형 AI 등 AI 모델 학습 작업 시 효율적으로 활용 가능한 서버

이외에도 ▴슈퍼컴퓨터 6호기 운영 최적화를 위해 사전 도입하는 '파일럿 시스템*'의 스토리지 용량ㆍ노드수 조건을 메인시스템의 1%에서 0.5%로 절반 수준으로 낮추었고, ▴인건비 절감을 위해 기술지원 전담 인력 최소 인원 조건도 완화했다.

* 파일럿 시스템 : 6호기 메인시스템과 동일 사양 혹은 같은 계열의 아키텍처로 메인시스템과 바이너리 호환이 되는 시스템. 응용 소프트웨어 포팅 및 최적화를 수행하는 역할과 5호기 퇴역에 따른 자원 부족을 조기에 확보하고자 하는 목적

정부는 기존 슈퍼컴퓨터 5호기 '누리온(실측성능 13.9PF)'의 평균 시스템 사용률이 77%*, 최대 90%에 달해 과부하 상태라고 판단하고 이를 대체할 새로운 슈퍼컴퓨터 도입을 추진했다. 그리고 이를 위한 '국가 플래그십 초고성능컴퓨팅 인프라 고도화 사업**'이 총 사업비 2,929억원 규모로 예비 타당성 조사를 통과하였고('22.8월) '23년부터 사업이 추진 중이다.

* 최근 5년간 슈퍼컴퓨터 5호기(누리온) 평균 시스템 사용률 ('19) 63.1%, ('20) 81.7%, ('21) 78.2%, ('22) 74.6%, (~'23.8) 77.4%

** '국가 플래그십 초고성능컴퓨팅 인프라 고도화 사업(R&D)' 개요

- (목적) 세계적 수준의 국가 플래그십 초고성능컴퓨터 6호기를 적기 구축ㆍ운영하여 거대 계산과학ㆍAI 중심 과학기술ㆍ산업 경쟁력 강화 및 발전 촉진

- (사업기간) '23~'28년(6년) / (보유기관) 한국과학기술정보연구원(KISTI)

- (시스템 정보) 600PF(페타플롭스) 성능 규모를 갖춘 초고성능컴퓨팅 시스템

- (총사업비) 2,929.49억원('23년 184.2억원, '24년 181.8억원)

그런데 올해 초 챗GPT 열풍이 불면서 생성형 AI 모델 학습에 필요한 AI반도체와 GPU 가격이 급등하였고, 기존 사업비로는 해외 제조사들이 원하는 입찰 가격을 맞추지 못해 지난 5월과 7월, 2차례 공고*가 유찰되었다.

* (1차 공고) '23.5.31 ~ 7.26, 무응찰에 따른 유찰

  (2차 공고) '23.7.27 ~ 8.8,  무응찰에 따른 유찰

이에 슈퍼컴퓨터 6호기 도입 주관 기관인 한국과학기술정보연구원(KISTI)은 신속한 도입을 위해 예타 규격 내에서 조건을 최소로 완화하여 재공고를 추진한다고 밝혔고*, 현재 3차 공모가 진행 중이다('23.9.14~10.26).

* “환율 상황 등 슈퍼컴퓨터 6호기 도입은 최악의 조건에서 추진되고 있다. 연구자들의 연구에 차질이 빚어지지 않도록 2024년 연말 운영을 목표로 노력하겠다.” (김재수 한국과학기술정보연구원(KISTI) 원장, '23.8.18)

그런데 막상 완화된 공모 조건을 확인하니 600PF급 연산 능력만 유지 되고 ▴AI 모델 학습을 위한 연산 장치, ▴메인시스템 사전 최적화을 위한 파일럿 시스템 성능, ▴시스템 유지ㆍ보수를 위한 전담 인력 등 슈퍼 컴퓨터 운영의 부가적인 영역 상당 부분을 포기한 것으로 나타난 것이다.

이정문 의원은 “당초 슈퍼컴퓨터 6호기는 생성형 AI 모델 학습을 요구한 학계 의견을 수용해 대량의 AI 반도체를 탑재하여 초거대 AI 개발에 적합한 형태로 만들려고 했지만 목표 수정이 불가피해졌다.”라며

“심지어 공모 가격은 동일한 1억 4천만 달러인데 최근 환율 상승으로 인해 원화 도입 가격이 100억원 가량 올랐다*. 결국 성능이 더 떨어지는 슈퍼컴퓨터를 더 비싼 가격에 들여와야 하는 상황인 것이다. 과기부와 KISTI는 상황을 냉철하게 분석하여 슈퍼 컴퓨터 6호기 도입 취지를 달성할 수 있는 현실적인 방안을 마련해야 한다.”고 촉구했다.

* 슈퍼컴퓨터 6호기 공모 가격 : 145,645,646달러

- 2차 공모 기준 원화 가격(환율 1,284원, '23.07.27) : 약 1,870억원

- 3차 공모 기준 원화 가격(환율 1,358원, '23.10.19) : 약 1,978억원

저작권자 © 뉴스워커 무단전재 및 재배포 금지