ByteDance의 새로운 AI 모델이 '딥페이크' 기능 덕분에 큰 화제를 모으고 있습니다.

TikTok의 모회사인 ByteDance는 이미지와 사운드를 사실적인 비디오로 바꿀 수 있는 인공지능(AI) 모델을 출시했습니다.

ByteDance의 개발팀에 따르면, OmniHuman-1이라는 멀티모달 모델은 "현재의 비디오 생성 방법보다 뛰어난" 품질로 캐릭터가 말하고, 노래하고, 움직이는 몰입형 비디오를 만들 수 있습니다.

실제 사람과 유사한 이미지, 비디오 및 사운드를 생성하는 AI 기술은 "딥페이크"라고도 알려져 있습니다. 이 기술은 엔터테인먼트뿐만 아니라 사기에도 점점 더 많이 사용되고 있습니다.

ByteDance는 중국에서 가장 인기 있는 AI 회사 중 하나입니다. 이 회사의 두바오 앱은 중국 본토 사용자들에게 가장 인기가 많습니다.

OmniHuman-1은 아직 대중에게 공개되지 않았지만, 샘플 영상은 빠르게 퍼져나갔습니다.

가장 돋보이는 데모 중 하나는 알베르트 아인슈타인이 연설하는 모습을 담은 23초 분량의 영상입니다. TechCrunch는 이 앱의 제품을 "충격적으로 굉장하다"고 "지금까지 나온 가장 사실적인 딥페이크 영상"이라고 설명합니다.

개발자에 따르면, OmniHuman-1에는 음성이나 보컬과 같은 오디오 데이터와 함께 참조 데이터로 단일 이미지만 있으면 되므로 길이에 상관없이 비디오를 만들 수 있다고 합니다.

출력 비디오 프레임 속도는 물론, 비디오 속 캐릭터의 "신체 비율"도 조정할 수 있습니다.

ByteDance는 중국에서 가장 유명한 AI 회사 중 하나입니다. 사진: TechCrunch

그뿐만 아니라, 비공개 소스에서 얻은 1만 9,000시간 분량의 비디오 콘텐츠로 훈련된 AI 모델은 기존 비디오를 편집할 수 있으며, 심지어 사람의 손과 발 동작을 설득력 있게 바꿀 수도 있습니다.

그러나 ByteDance는 OmniHuman-1이 완벽하지 않다는 것을 인정했습니다. 특정 포즈에서는 여전히 어려움이 있고, "저품질 참조 이미지"로는 최고의 비디오를 만들 수 없다고 말했습니다.

ByteDance의 새로운 AI 모델은 워싱턴의 기술 수출 제한 노력에도 불구하고 중국의 진전을 보여줍니다.

우려사항

작년에는 정치적 딥페이크 영상이 널리 퍼졌습니다. 몰도바에서는 딥페이크 영상에서 마이아 산두 대통령이 사임 연설을 하는 모습이 재현되었습니다.

그리고 남아프리카공화국에서는 래퍼 에미넴이 남아프리카 공화국 야당을 지지하는 모습을 담은 딥페이크 영상이 국가 선거를 앞두고 급속히 퍼졌습니다.

딥페이크는 금융 범죄를 저지르는 데에도 점점 더 많이 이용되고 있습니다. 소비자들은 유명인이 투자를 추천하고, 가짜 투자 기회를 제공하는 딥페이크 영상에 속고 있으며, 기업들은 고위 임원을 사칭하는 사칭범 때문에 수백만 달러의 손실을 입기도 했습니다.

Deloitte에 따르면, AI가 생성한 콘텐츠로 인해 2023년에 사기로 인한 손실이 120억 달러가 넘었으며, 2027년까지 미국에서는 400억 달러에 이를 수 있습니다.

지난 2월, AI 커뮤니티의 수백 명이 딥페이크에 대한 엄격한 규제를 요구하는 서한에 서명했습니다. 미국에서는 연방 차원에서 딥페이크에 대한 범죄화가 이루어지지 않음에 따라 10개 이상의 주가 AI 위조를 금지하는 법률을 제정했습니다.

하지만 딥페이크를 감지하는 것은 쉽지 않습니다. 일부 소셜 네트워크와 검색 엔진이 딥페이크 콘텐츠의 확산을 제한하기 위한 조치를 취했지만, 온라인에서 딥페이크 콘텐츠의 양은 여전히 놀라운 속도로 늘어나고 있습니다.

신원 확인 회사 Jumio가 2024년 5월에 실시한 설문조사에 따르면, 응답자의 60%가 지난 1년 동안 딥페이크를 접한 적이 있다고 답했습니다. 응답자의 72%는 매일 딥페이크에 속는 것이 걱정이라고 답했고, 대다수는 AI가 생성한 가짜 영상의 급증을 해결하기 위한 법안 통과를 지지했습니다.