SEARCH

검색창 닫기
  • BTC
  • ETH
  • XRP
  • BCH
bithumb제공 bithumb제공
  • BTC
  • ETH
  • XRP
  • BCH
bithumb제공 bithumb제공

모자이크 사진도 고해상도 사진으로 바꾼 AI 기술은?

듀크대 연구팀, 사진 해상도 높이는 AI 솔루션 정확도 높였다

모자이크 사진이 고해상도 사진으로 바뀐 모습./출처=Duke University

모자이크 처리된 사진도 고해상도 사진으로 만들 수 있는 인공지능(AI) 기술이 개발됐다.

미국 듀크대학교 연구팀은 지난 11일(현지시간) 흐릿한 인물 사진을 고해상도 사진으로 바꿀 수 있는 AI 솔루션을 개발했다. 기존 AI 솔루션은 인물 사진 해상도를 원래 해상도의 최대 8배까지 높일 수 있었지만, 듀크대 연구원들이 개발한 솔루션은 최대 64배까지 높일 수 있다.

듀크대 연구팀, 어떤 방법 사용했나
흐릿한 사진이 어떻게 뚜렷한 사진으로 바뀌게 된 걸까. 듀크대 연구팀은 일종의 ‘상상’ 기술을 동원해 해상도를 크게 높였다. 흐릿한 사진에서는 보이지 않는 미세한 선이나 속눈썹 등을 AI가 상상해서 사진에 넣음으로써 사실적인 얼굴을 만드는 방식이다. 연구팀을 이끈 신시아 루딘(Cynthia Ludin) 듀크대 컴퓨터과학자는 “(매우 흐릿한) 세부사항만 가지고 이 정도로 정교한 이미지를 만들어낸 솔루션은 없었다”고 강조했다.

기존에도 비슷한 기술은 있었으나, 듀크대 연구팀은 AI를 학습시키는 방식을 바꿈으로써 상상 기술의 정확도를 높였다. AI는 경험을 통해 학습하는 머신러닝을 통해 정확도가 높아진다. 따라서 기존 AI 솔루션들은 저해상도 이미지에 보이지 않는 세부사항을 추가하는 방법을 반복함으로써 학습했다. 이와 반대로 듀크대 팀은 AI가 만든 고해상도 이미지에서 기존 저해상도 이미지에 없는 부분을 찾아내는 작업을 반복함으로써 AI를 학습시켰다.

‘진짜↔가짜’ 판별..진짜에 가까워지는 ‘GAN’ 알고리즘도 쓰여
인공지능 알고리즘 중 하나인 GAN(Generative Adversarial Network, 생산적 적대 신경망) 기술도 쓰였다. GAN 기술은 머신러닝의 방식 중 하나인 ‘비지도학습’ 기술로 분류된다. 비지도학습이란 정답을 알려주며 AI를 학습시키는 지도학습과 달리, 정답을 알려주지 않고 비슷한 데이터를 모으게 함으로써 결과를 예측하도록 하는 머신러닝 방식이다. GAN에서는 최대한 진짜 같은 데이터를 생성하려는 ‘생성 모델’과 진짜와 가짜를 판별하려는 ‘분류 모델’이 서로 적대적으로 경쟁하며 학습한다.

듀크대 팀의 AI 솔루션에선 최대한 진짜 같은 고해상도 사진을 생성하려는 ‘생성 모델’과 진짜 사진과 AI 생성 사진 중 어떤 게 진짜인지 판별하려는 ‘분류 모델’이 서로 적대적으로 경쟁했다. 분류 모델이 차이를 구별할 수 없을 때까지 생성 모델은 고해상도 사진을 생성하게 되고, 생성모델의 정확도는 더욱 높아졌다.

이처럼 듀크대 팀은 여러 시도를 통해 정확도 높은 AI 솔루션을 만들어냈다. 하지만 한계 역시 존재한다. 사진은 뚜렷해졌지만, 보이지 않는 부분은 AI가 상상한 것이므로 사진 속 인물의 얼굴이 실제 인물의 얼굴과 일치한다는 보장은 없다. 예를 들어 CCTV 속 범죄자의 흐릿한 얼굴을 뚜렷한 얼굴로 만든다고 해도 뚜렷해진 사진을 범죄자 검거에 사용할 순 없다. 보이지 않는 부분은 그럴듯하게 상상된 결과물이기 때문에 사람을 식별하는 데에 이 기술을 사용할 순 없는 것이다.
/박현영기자 hyun@decenter.kr

박현영 기자
hyun@decenter.kr
< 저작권자 ⓒ 디센터, 무단 전재 및 재배포 금지 >

이메일보내기