인공지능(AI) 아나운서가 뉴스를 진행한다. 표정, 말투, 입 모양 까지도 인간 아나운서를 보는 것 같다.
중국 관영매체 신화통신이 지난달 선보인 AI 아나운서 ‘신샤오멍’은 실제 아나운서들의 목소리와 얼굴 데이터를 기반으로 탄생했다. 기준이 된 실제 모델은 있지만 신샤오멍은 기존에는 없던 뉴페이스다. 신샤오멍은 진짜 아나운서인가, 가짜 아나운서인가?
진짜와 가짜를 구분 짓기 힘든 시대. AI가 만들어낸 새로운 풍경이다. 트럼프를 모욕하는 버락 오바마의 영상은 사실처럼 보인다. 신샤오멍과 ‘가짜’ 오바마를 만들어낸 이 창의적인 기술은 GAN(Generative Adversarial Network), 생성적 적대 신경망이다.
GAN 기술은 “진짜와 같은 가짜”를 만들어 내는 것을 목적으로 한다. 이를 위해 가짜를 만드는 생성자 머신러닝 모델(Generator)과 진짜와 가짜를 구분하는 감별자 머신러닝 모델(Discriminator) 두 가지를 사용하게 된다. GAN을 발표한 이안 굿펠로우는 이를 “위조지폐범(Generator)과 경찰(Discriminator)”로 비유했다.
GAN이 진짜 같은 위조지폐, 사람 같은 AI 아나운서를 만드는 과정은 다음과 같다. 먼저 생성자가 기존의 데이터를 바탕으로 새로운 창작물을 만들어낸다. 감별자 단계에 간 창작물은 이것이 “위조지폐인지 아닌지”에 대한 검사를 받는다. 그런데 여기에서 허술한 창작물들은 감별자에 의해 걸러지게 된다. 예를 들어 ‘강아지’에 대한 데이터를 기반으로 새로운 강아지 이미지를 만들어 낼 때, 생성자가 데이터를 기반으로 무작위로 만들어진 이미지들 중에서는 강아지로 부르기 힘든 이미지들이 섞여있다. 감별자는 진짜 강아지 이미지들과 비교했을 때 손색없는 이미지들만을 통과시키는 것이다.
GAN은 생성자와 감별자 두 가지의 머신러닝 모델이 서로 경쟁하는 과정을 반복하며 데이터를 쌓는다. 이렇게 효율성과 정확도를 높이며 학습하고 발전해 나간다. GAN는 수동적 학습에서 벗어난 능동적 학습을 할 수 있는 비지도학습 AI의 초석을 만든 것으로 평가받는다.
이미지, 음성, 영상 등 각 분야에 활용
페이스북이 개발한 리얼아이오프너는 눈을 감은 사진을 눈 뜬 사진으로 변환시켜준다. GAN을 통해 진짜 같은 가짜 눈을 만들어 사진에 그럴듯하게 입힌다.
국내에서는 네이버가 GAN을 웹툰에 적용하기도 했다. 지난 2017년 공개된 네이버 웹툰 ‘마주쳤다’에서는 애플리케이션을 이용해 사용자가 셀카를 찍으면 GAN을 통해 사용자의 사진을 작가 화풍의 웹툰 주인공 캐릭터로 만들어 웹툰의 주인공이 될 수 있게 해 준다.
GAN은 음성과 영상에도 쓰이고 있다. 가장 많이 알려진 사례가 지난해 8월 워싱턴 대학교에서 버락 오바마의 영상을 만든 ‘딥페이크’ 기술이다. 딥페이크는 딥러닝과 페이크의 합성어로, AI를 이용해 인물 이미지를 영상에 합성하는 GAN 기술이다. 온라인 커뮤니티에 헐리우드 배우들의 가짜 포르노 합성물을 올린 이용자의 아이디에서 시작됐다.
전문가들은 AI를 이용한 범죄를 우려하지만, AI 활용과 관련된 국제적 기준과 규범은 이제 막 논의 단계에 있다. 국내에서는 딥페이크를 이용한 음란 영상 제작과 배포는 불법이다. 유명인의 사진을 합성하는 경우 초상권 침해에 해당한다. AI의 악용과 관련된 직접적인 법안은 마련돼 있지 않다.
/원재연 기자 wonjaeyeon@decenter.kr
- 원재연 기자
- wonjaeyeon@decenter.kr