[산업기획] 한국, AI 시대 도래 대비 AI 하드웨어 개발 역량 키운다
[산업기획] 한국, AI 시대 도래 대비 AI 하드웨어 개발 역량 키운다
  • 염정민 기자
  • 승인 2020.04.16 16:31
  • 댓글 0
이 기사를 공유합니다

- AI시대 도래 대비하여 관련 산업에 역량 투입 지속 해야

[산업기획_뉴스워커] 지난 4월 7일 ‘ETRI(한국전자통신연구원)’과 ‘SKT(SK텔레콤)’은 공동연구를 통해 고성능 서버에 적용이 가능한 ‘NPU(신경망처리장치)’ 기반의 AI 반도체를 개발했으며, ETRI와 ‘전자부품연구원’ 등은 모바일 디바이스용 시각지능 AI 반도체를 독자 개발하는 것에 성공했다.

그래픽_황성환 그래픽1팀 기자
그래픽_황성환 그래픽1팀 기자

 서버용 초전력 AI 반도체와 모바일 디바이스용 시각지능 AI 반도체 독자개발


‘NPU(Neural Processing Unit)’는 수많은 신경세포와 시냅스로 연결된 인간의 신경망을 모방하여 만든 처리장치로 기존 ‘CPU(중앙처리장치)’가 데이터를 순차적으로 계산하는 것과는 달리 많은 종류의 데이터를 동시다발적으로 계산하는 차이가 있다.

AI 시스템에는 다양한 데이터를 지연 없이 신속하게 처리하는 것이 요구되는데 자율주행 자동차를 연상해보면 자율주행 자동차의 AI는 앞차와의 거리, 돌발적으로 튀어나오는 물체, 중앙선 등 많은 종류의 데이터를 신속하게 처리할 필요가 있다는 것을 쉽게 이해할 수 있다.

이때 순차적으로 연산을 하는 CPU는 앞차와의 거리에 대한 연산이 끝나면 중앙선 등 다음 연산으로 넘어가는 구조인데 반해, NPU는 앞차와의 거리에 대한 연산을 하는 동시에 중앙선 등에 관한 연산을 수행할 수 있는 구조를 갖고 있다.

따라서 자율주행 자동차의 AI 시스템이 다양한 정보를 처리해야 하는 상황에서 CPU는 처음 연산에서 다음 연산으로 넘어가는 동안 시간 지연이 다수 발생할 수밖에 없지만, NPU는 동시다발적인 연산이 가능하므로 연산과 연산 사이의 지연이 없거나 적고 그에 따라 신속한 대응이 가능하다는 점에서 AI 하드웨어로서 주목을 받고 있는 것이다.

또한 NPU는 축적된 데이터를 바탕으로 스스로 학습하여 최적의 값을 산출하는 것도 가능하므로 AI 시스템의 전제인 시스템 스스로 학습하는 ‘머신러닝(Machine Learning)’, ‘딥 러닝(Deep Learning)’ 기능을 구현하는 것에도 우수한 것으로 평가받는다.

한편 ETRI와 SKT는 초당 40조 번(40TFLOPS)의 데이터 연산이 가능하고 15~40W 수준의 낮은 전력을 소모하는 AI 반도체를 독자 개발했는데, 이 반도체를 클라우드 데이터 센터 등에 사용할 경우 ‘연산능력/소모전력’으로 규정되는 ‘AI 서비스에 대한 전력효율’은 10배 이상 향상될 수 있을 것이란 전망이다.

연구진은 17mm X 23mm의 크기로 반도체를 소형화하는데 성공했으며 반도체에 1만 6384개의 연산장치(Core)를 집적하여 초당 40조 번의 데이터 연산이 가능할 정도로 반도체의 성능을 극대화했다고 설명했다.

기존의 클라우드 데이터 센터에 사용되는 제품의 경우 전력소비가 300W에 달할 정도로 큰 것에 반해 이번에 개발된 반도체는 10~40W 수준의 전력만 소모하므로, 해당 반도체는 전력효율이 1~3 TFLOPS/W를 기록하여 GPU 기준으로 0.1 TFLOPS/W인 기존 반도체와 비교하여 10배 이상 우수한 성능을 가지고 있는 것으로 평가된다.

게다가 연구진들은 해당 반도체를 SKT 데이터 센터 등에 적용하여 실제 환경에서 개발된 칩의 성능을 실증하고 사업화에 나설 계획이라고 덧붙였다.

한편 ETRI, 전자부품연구원(KETI)와 ‘에프에이리눅스’등 국내 기업들이 공동으로 사람의 시각처럼 물체를 인식할 수 있고 지능형 CCTV나 드론과 같은 모바일과 사물인터넷(IoT) 디바이스에 탑재할 수 있는 시각지능 AI 반도체를 개발하는데 성공했다.

연구진에 따르면 해당 반도체는 성인 손톱 크기의 절반 수준인 5mm X 5mm로 소형화되어 회로 면적을 최소화했음에도 초당 30회(FPS)의 물체인식이 가능한 성능을 보유한 것으로 알려졌다.

또한 이번에 개발된 반도체의 전력소모는 실험실에서 최대 0.5W를 기록한 바 있는데, 기존 GPU 기준으로 5~10W를 기록한 것과 비교할 때 전력소모가 1/10 이하로 평가된다.

올해 하반기부터 연구진들은 영상 감시와 정찰 분야 등 AI 기반 지능형 디바이스에 개발된 반도체를 장착하여 성능 실증화와 사업화를 추진할 계획이라고 덧붙였다.


 이미지 생성, 재생성이 가능한 AI 반도체 개발


지난 4월 7일 ‘KAIST’는 전기및전자공학부 ‘유회준’ 교수 연구팀이 적은 전력을 투입하여 높은 효율의 ‘GAN(생성적 적대 신경망)’을 구현할 수 있는 AI 반도체를 개발했다고 밝혔다.

GAN이란 AI를 학습시키는 방식 중 하나이다.

간략하게 GAN의 개념을 설명하면 ‘A(Generator, 생성자)’, ‘B(Discriminator, 감별자)’로 정의되는 2개의 서로 대립된 AI(인공지능) 네트워크가 정보를 주고받으면서 AI를 스스로 학습시키는 것으로 볼 수 있다.

A는 습득한 실제 데이터를 기초로 데이터의 특징을 파악한 후 ‘거짓 데이터를 생성’하여 B에게 주면, B는 A가 준 데이터의 특성을 파악하여 ‘거짓 데이터인지 실제 데이터인지 구별’하여 이와 관련한 결론을 낸다.

이때 A는 B가 속지 않은 이유를 학습하여 더욱 그럴듯한 거짓 데이터를 생성하고 B는 A에게 속은 이유를 학습하여 실제 데이터를 구분하는 능력을 키우게 된다.

이 과정을 끊임없이 반복하면 AI는 실제 데이터를 감별할 수 있는 능력이 매우 높은 수준으로 학습되는 것이다.

비유하자면 위조지폐 범죄자가 정교한 위조지폐를 만들어 감별사에게 전달하고 그에 관련한 피드백을 받음으로써 더욱 정교한 위조지폐를 만들 수 있는 것처럼 GAN은 서로 대립되는 인공지능 네트워크가 계속해서 정보를 교환함으로써 스스로 학습하는 방식이라고 설명할 수 있다.

GAN은 생성자가 새로운 데이터의 생성을 전제하고 있으므로 실제와 가까운 이미지를 생성하거나 보정하여 고화질의 동영상을 제작하는 것에 흔히 이용되기도 한다.

지난 2017년 8월 워싱턴대학 연구진이 ‘버락 오바마’ 전 미국 대통령의 가짜 영상을 제작하여 공개하기도 했던 것처럼 GAN은 ‘딥 페이크(deep fake)’란 이미지 합성에도 적용되는 것을 전문가가 아닌 일반인들도 일상생활에서 쉽게 접할 수 있다.

그런데 고화질 동영상을 제작하기 위해 고용량의 데이터를 생성하고 처리해야 하는 GAN은 기존 신경망 모델보다 수십 배 많은 연산량을 요구하므로, 연산능력이 제한적이고 메모리가 작은 모바일 장치에서 소프트웨어만으로 구현하는 것에는 한계가 있었다.

따라서 연구진은 이와 같은 한계를 해결하기 위해 GAN에 특화된 성능을 가진 AI 반도체인 ‘GANPU(생성적 적대 신경망 처리 장치)’를 개발했다.

연구진은 GANPU가 기존 심층 신경망 학습 반도체 대비 4.8배 증가한 에너지 효율을 달성하는 것에 성공했다고 설명했으며, GANPU를 활용할 수 있는 예로 태블릿 카메라로 촬영한 사진을 사용자가 직접 보정할 수 있음을 시연하기도 했다.

‘강상훈’ 박사과정이 1 저자로 참여한 관련 논문은 지난 2월 17일 미국 샌프란시스코의 국제고체회로설계학회(ISSCC)에서 발표되기도 했다.

자율주행 자동차, 드론 등 AI 관련 기술 중요도는 날이 갈수록 커지고 있고 실제 생활에 AI 기술이 접목되는 경우도 계속 증가하고 있어 한국도 AI 시대의 도래에 대비하여 AI 관련 산업에 대한 역량 투입을 지속하고 있다.


최신기사
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0 - 상대에 대한 비방글은 예고없이 삭제될 수 있습니다.
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.