SEARCH

검색창 닫기
  • BTC
  • ETH
  • XRP
  • BCH
bithumb제공 bithumb제공
  • BTC
  • ETH
  • XRP
  • BCH
bithumb제공 bithumb제공

"진짜같은 가짜 만들기" AI 아나운서 만든 GAN 기술은?

2014년 이안 굿펠로우 발표, 가장 빠르게 진화하는 AI 기술

'생성자' 와 '감별자' 두 가지 머신러닝으로 데이터 축적

이미지 생성, 합성 등에 사용…딥페이크로 가짜 포르노 만들기도

국제적 기준과 표준, 처벌 규정 아직 미비,

AI 아나운서 ‘신샤오멍’

인공지능(AI) 아나운서가 뉴스를 진행한다. 표정, 말투, 입 모양 까지도 인간 아나운서를 보는 것 같다.

중국 관영매체 신화통신이 지난달 선보인 AI 아나운서 ‘신샤오멍’은 실제 아나운서들의 목소리와 얼굴 데이터를 기반으로 탄생했다. 기준이 된 실제 모델은 있지만 신샤오멍은 기존에는 없던 뉴페이스다. 신샤오멍은 진짜 아나운서인가, 가짜 아나운서인가?

진짜와 가짜를 구분 짓기 힘든 시대. AI가 만들어낸 새로운 풍경이다. 트럼프를 모욕하는 버락 오바마의 영상은 사실처럼 보인다. 신샤오멍과 ‘가짜’ 오바마를 만들어낸 이 창의적인 기술은 GAN(Generative Adversarial Network), 생성적 적대 신경망이다.



두 개의 머신러닝 모델로 만들어진 GAN
2014년 구글 브레인 소속의 이안 굿펠로우가 세계적인 머신러닝 학회 NIPS(Neural Information Processing Systems)에서 최초로 발표한 GAN 기술은 AI 업계에서 가장 빠른 속도로 발전해왔다. 지난해 미국 매세추세츠 공과대학이 매년 발표하는 ‘MIT 테크놀로지 리뷰’에서는 10대 혁신기술 중 하나로 선정되기도 했다.

GAN 기술은 “진짜와 같은 가짜”를 만들어 내는 것을 목적으로 한다. 이를 위해 가짜를 만드는 생성자 머신러닝 모델(Generator)과 진짜와 가짜를 구분하는 감별자 머신러닝 모델(Discriminator) 두 가지를 사용하게 된다. GAN을 발표한 이안 굿펠로우는 이를 “위조지폐범(Generator)과 경찰(Discriminator)”로 비유했다.

GAN의 작동 방식

GAN이 진짜 같은 위조지폐, 사람 같은 AI 아나운서를 만드는 과정은 다음과 같다. 먼저 생성자가 기존의 데이터를 바탕으로 새로운 창작물을 만들어낸다. 감별자 단계에 간 창작물은 이것이 “위조지폐인지 아닌지”에 대한 검사를 받는다. 그런데 여기에서 허술한 창작물들은 감별자에 의해 걸러지게 된다. 예를 들어 ‘강아지’에 대한 데이터를 기반으로 새로운 강아지 이미지를 만들어 낼 때, 생성자가 데이터를 기반으로 무작위로 만들어진 이미지들 중에서는 강아지로 부르기 힘든 이미지들이 섞여있다. 감별자는 진짜 강아지 이미지들과 비교했을 때 손색없는 이미지들만을 통과시키는 것이다.

GAN은 생성자와 감별자 두 가지의 머신러닝 모델이 서로 경쟁하는 과정을 반복하며 데이터를 쌓는다. 이렇게 효율성과 정확도를 높이며 학습하고 발전해 나간다. GAN는 수동적 학습에서 벗어난 능동적 학습을 할 수 있는 비지도학습 AI의 초석을 만든 것으로 평가받는다.

엔비디아의 고갱


이미지, 음성, 영상 등 각 분야에 활용
GAN이 가장 많이 쓰이는 곳은 이미지 생성과 합성, 컴퓨터 비전 등의 분야다. 지난 20일 엔비디아가 발표한 ‘고갱(GauGAN)’ 또한 이미지를 만드는 GAN이다. 고갱은 화가 폴 고갱의 이름에서 따왔다. 사용자가 한 낙서도 폴 고갱의 그림처럼 바꿔주기 때문이다. 예를 들어 사용자가 초록색 선을 하나 긋고 ‘나뭇가지’라는 태그를 선택하면, 고갱은 그림을 분석해 사진과 흡사한 효과를 입힌다. 단순 합성이 아니라, 수 백 만 개 이상의 이미지 데이터를 분석한 고갱이 사진을 모방해 새로 그려내는 것이다.

페이스북이 개발한 리얼아이오프너는 눈을 감은 사진을 눈 뜬 사진으로 변환시켜준다. GAN을 통해 진짜 같은 가짜 눈을 만들어 사진에 그럴듯하게 입힌다.

웹툰 ‘마주쳤다’의 이미지 생성 방식

국내에서는 네이버가 GAN을 웹툰에 적용하기도 했다. 지난 2017년 공개된 네이버 웹툰 ‘마주쳤다’에서는 애플리케이션을 이용해 사용자가 셀카를 찍으면 GAN을 통해 사용자의 사진을 작가 화풍의 웹툰 주인공 캐릭터로 만들어 웹툰의 주인공이 될 수 있게 해 준다.

GAN은 음성과 영상에도 쓰이고 있다. 가장 많이 알려진 사례가 지난해 8월 워싱턴 대학교에서 버락 오바마의 영상을 만든 ‘딥페이크’ 기술이다. 딥페이크는 딥러닝과 페이크의 합성어로, AI를 이용해 인물 이미지를 영상에 합성하는 GAN 기술이다. 온라인 커뮤니티에 헐리우드 배우들의 가짜 포르노 합성물을 올린 이용자의 아이디에서 시작됐다.

딥페이크로 만들어낸 버락 오바마. 어느 쪽이 진짜일까

악용 소지 많지만, 규범과 기준 아직 부족
GAN은 범죄의 유혹에 노출되어있기도 하다. 유명인들의 가짜 포르노 합성물 등 자극적인 가짜 영상, 가짜 뉴스를 감쪽같이 만들어 낼 수 있기 때문이다. 온라인에 소스코드가 공개되어 있어 누구나 제작 가능한 점도 우려를 낳는다. 지난 2016년 미국 대선후보였던 마르코 루비오는 딥페이크를 ‘핵무기’라고 비유하기도 했다.

전문가들은 AI를 이용한 범죄를 우려하지만, AI 활용과 관련된 국제적 기준과 규범은 이제 막 논의 단계에 있다. 국내에서는 딥페이크를 이용한 음란 영상 제작과 배포는 불법이다. 유명인의 사진을 합성하는 경우 초상권 침해에 해당한다. AI의 악용과 관련된 직접적인 법안은 마련돼 있지 않다.

/원재연 기자 wonjaeyeon@decenter.kr

원재연 기자
wonjaeyeon@decenter.kr
< 저작권자 ⓒ 디센터, 무단 전재 및 재배포 금지 >

이메일보내기