한국, 14조 원 들여 엔비디아 GPU 대량 확보.. AI 총력전, '머신언러닝' 기술 개발 급가속
개인정보보호 위해 ‘디지털 장의사’, ‘AI 지우개 서비스’ 필요하다는 목소리 높아져…

한국이 AI 강국으로 도약하기 위해 천문학적 투자를 쏟아붓는 한편, 'AI를 잊게 만드는 기술'이 뜨거운 화두로 떠오르고 있다. 이 같은 흐름은 국제 연구 무대에서도 분명하게 드러난다. 실제로 세계 최고 권위의 인공지능 학회 'NeurIPS 2025'에 채택된 '머신 언러닝(Machine Unlearning)' 관련 논문 수는 최근 5년간 빠른 증가세를 보였다. 데이터 프라이버시 문제와 직결되는 이 기술은 국내 학계에서도 비중 있게 다뤄지고 있다. 최근 APEC 기간 중 중앙대학교에서 열린 ‘인공지능 시대의 데이터 프라이버시와 전문인력 양성’ 세미나가 대표적이다. 이 자리에서 김호기 중앙대 산업보안학과 교수는 ‘데이터 프라이버시와 인공지능: 잊혀질 권리’를 중심으로 주제 발표를 통해 AI 시대 '잊혀질 권리'의 중요성을 강조했다.
머신 언러닝은 인공지능 모델이 학습한 내용 중 일부를 특정하여, 의도적으로 '잊도록' 하는 기술로, GDPR, CCPA와 같은 개인정보 보호 규정이 사용자의 '잊힐 권리'를 보장하면서 필수 기술로 자리 잡았다. 이제 AI 모델에 대한 '지우개 서비스'는 선택이 아닌 필수다.
생성형 AI는 학습한 텍스트와 이미지를 바탕으로 결과물을 출력한다. 만약 이런 AI의 개발사가 내 허락 없이 개인정보를 가져다 학습시켰다면, AI가 나의 이름·초상·취향 등을 다른 사람에게 제공할 수도 있다. 그렇다면 그 AI 모델은 폐기해야 마땅할까, 아니면 선택적으로 '잊게' 할 수 있을까? 사실 모델이 특정 정보를 '잊게' 하는 기술은 개인정보 침해 대응뿐만 아니라, AI가 잘못 학습되었을 때의 '롤백'을 위해서도 반드시 필요하다. 이는 모델 전체를 재학습시키는 막대한 비용 없이도, 편향되거나 잘못된 정보만 골라내어 수정할 수 있게 해주는 핵심 기술이다.
한 번 학습하면 영원히 기억? AI의 치명적 딜레마
"재학습 비용 1조원 vs 머신언러닝 1000만원"... 기술 격차가 생존 가른다
정책 바뀔 때마다 AI 모델 통째로 날려야? 기업들 '패닉' 방지하는 기술
데이터가 한 번 AI 모델 속에 흡수되면, 사실상 영구 기록으로 남는 경우가 많다. 이는 이용자 동의·저장·활용·삭제 요청 등 다양한 법적·제도적 절차와 충돌하는 핵심 이슈로 꼽힌다. 유럽연합(EU)의 일반개인정보보호법(GDPR, General Data Protection Regulation)이 제시한 ‘잊혀질 권리(right to be forgotten)’ 개념이 대표적이다. 국내 개인정보위 또한 공개한 <생성형 AI 개발·활용을 위한 개인정보 처리 안내서>를 발표했으며, 정보주체가 개인정보 삭제를 요구하면 AI 개발사는 10일 내로 대응해야 한다.
GDPR 제17조 '잊힐 권리'는 데이터 주체는 자신의 개인정보에 대해 지체 없이 삭제를 요구할 권리가 있고, 통제자(controller)는 그럴 의무가 있다
하지만 현실적으로 AI 모델은 정보를 문서처럼 한곳에 저장하지 않는다. 삼성SDS는 “AI가 학습한 정보는 모델 전체의 파라미터에 미세하게 분산돼 있기 때문에, 특정 데이터를 완전히 삭제하려면 처음부터 전체 모델을 다시 학습시켜야 한다”라며 “이는 엄청난 계산 비용과 시간이 필요한 비현실적인 방식”이라고 설명했다. 실제로 미국 연방거래위원회(FTC)는 개인정보를 무단 수집해 AI 학습에 사용한 기업들에 대해 ‘데이터뿐 아니라 그 데이터를 학습한 모델까지 폐기하라’는 명령을 내렸고, 이로 인해 일부 스타트업이 사업을 중단하거나 파산에 몰린 사례도 있다. 거대 언어모델을 처음부터 재학습하려면 수천억 원이 들어, ‘삭제 명령’이 곧 ‘사업의 종말’로 이어지는 셈이다. 이는 단순히 프라이버시 보호 문제 뿐 아니라 데이터나 왜곡된 샘플을 학습시킨 경우에도 겪게되는 문제이다.
이에 비해 머신언러닝 기술은 비용을 획기적으로 줄일 수 있다. 업계 관계자는 "GPT급 모델을 재학습하려면 수천만 달러가 들지만, 머신언러닝 기술이 상용화되면 그 비용을 대폭 수준으로 줄일 수 있다"라고 전망했다. 머신언러닝은 기존 모델을 통째로 재훈련하지 않고, 문제 되는 데이터가 남긴 흔적만 찾아 제거하거나 영향을 줄이는 기술이다. 모델의 기본 구조는 그대로 둔 채, 특정 데이터가 학습 과정에서 미친 영향을 역산해 수정하거나 대체 데이터로 덮어써서 마치 처음부터 그 정보를 배우지 않았던 것처럼 만드는 원리다. 이를 쉽게 비유하자면, 스웨터 한쪽에 잘못 짜인 실을 발견했을 때 전체를 풀어 다시 뜨개질하지 않고, 전문 수선가가 문제의 실만 정교하게 제거해 원형을 복원하는 과정과 비슷하다.
한국 연구진도 뛰어들었다... KAIST·서울대 "글로벌 경쟁력 확보"
우선 중앙대학교는 융합보안대학원에 개인정보보호 전공 석·박사 과정을 신설하며, AI 기술 활용과 개인정보 보호가 동시에 가능하도록 인재를 양성하겠다는 의지를 천명했다.
이와 더불어 국내 반도체·AI 인프라도 눈에 띄게 강화되고 있다. 이번 26만 장의 추가 확보로 미국과 중국에 이어 글로벌 3위 보유국에 올라서게 된다. 과학기술정보통신부의 고위 관계자는 “국내 독자 AI 파운데이션 모델 개발에 더해, 피지컬 AI(physical AI) 모델 개발까지 국가 AI 전략을 ‘투트랙’으로 확장하게 된다”고 밝힌 바와 함께, 개인정보보호위원회는 AI 시대의 안전한 데이터 활용 정책 방향으로, 정보주체가 요청하면 특정 데이터가 AI 모델 학습에 포함되지 않도록 하는 ‘머신 언러닝(Machine Unlearning)’ 기술 확보를 추진 중이라고 발표했다.
이 같은 흐름은 단순히 하드웨어 확보나 교육과정 개설에 그치지 않고, 산업·학계·정부가 협력하여 AI 생태계의 질적 성장을 도모하고 있다는 점에서 의미가 크다. 업계 전문가는 "한국이 GPU 인프라를 대규모로 확보한 만큼, 머신언러닝 같은 AI 안전 기술 개발에도 투자를 아끼지 않아야 한다"라며 "AI 강국이 되려면 '만드는 기술'과 '지우는 기술'을 동시에 발전시켜야 한다"고 강조했다. AI 시대의 역설이다. 더 많이 학습할수록, 더 잘 잊어야 한다. 26만 장의 GPU로 무장한 한국이 이 역설을 어떻게 풀어갈지 주목된다.
- 챗GPT, “12월부터 ‘에로티카’처럼 19금 허용” 도입...OpenAI 샘 알트먼,"성인은 성인답게" 공식 선언
- SK하이닉스, 3분기 영업이익 11조 돌파하며 사상 최대 실적 냈나?
- SK그룹, 엔비디아와 협력한 ‘제조 AI 클라우드’ 구축 내용은?
- 한글과컴퓨터, 랭체인 공식 구성요소 등재로 기술 경쟁력 입증했나?
- 현대자동차, 고난도 진단 인재 양성 위한 인턴십 프로그램 내용은?
- SK AI 서밋 2025, 최태원 회장이 제시한 AI 혁신 방향은?
- LG전자, 플렉스와 협력한 AI 데이터센터 냉각 솔루션 개발 내용은?
- “오늘 주춤한 현대차 주가”...새 보고서에는 “26년 하이브리드로 혼다 제친다” 美 판매 27%↑ 주가 상승 재료 언급…"목표가 36만원 상향"
- 한글과컴퓨터, 주주가치 제고 위한 자사주 매입에 나섰나?
- 카카오톡 업데이트 미루던 사람들, 신규 오픈채팅방 막히자 분통...친구 탭 복원 대체 언제쯤?
- SK하이닉스, HBM3·HBM3E 제품으로 ‘탄소 저감’ 인증 받았나?
- (재)진도군인재육성장학회, ‘2025 진도사랑 골든벨 개최’
- 진도군, 청소년이 직접 기획한 ‘쓰담쓰담 캠페인’ 전개
- ‘적자 전환’ 하이브 10일 하이브 3분기 실적 발표… 방시혁 도덕 리스크가 실적 쇼크의 결정적 변수였나
- 코웨이 USA, “미국서 노동법 분쟁”... 임금·노조 관련 사안으로 법적 절차 진행

