Китайская компания запускает ИИ для создания поддельных видеороликов, которые выглядят как настоящие

(Дэн Три) - ByteDance, материнская компания TikTok, удивила всех, представив инструмент на основе искусственного интеллекта, способный создавать видеоролики с реалистичным контентом.

ByteDance, технологическая компания, стоящая за социальной сетью TikTok, только что представила новую модель искусственного интеллекта (ИИ) под названием OmniHuman-1, способную создавать реалистичные анимированные видеоролики.

ByteDance заявила, что OmniHuman-1 основан на технологии deepfake, позволяющей создавать видеоролики с чрезвычайно плавными движениями, и очень сложно распознать, что это продукт искусственного интеллекта. ByteDance уверенно заявляет, что ее движок ИИ может создавать продукты более высокого качества по сравнению с другими существующими инструментами ИИ для создания видео.

Видеозапись выступления Альберта Эйнштейна, созданная OmniHuman-1 на основе изображения ученого (Видео: ByteDance).

По словам исследователей ByteDance, для моделирования OmniHuman-1 достаточно одного изображения и звука, например, голоса случайного человека или поющего голоса. На основе этих данных инструмент ИИ может генерировать видеоролики произвольной длины с голосами или вокалом, идентичными образцу аудио.

OmniHuman-1 также может редактировать и изменять существующие видео, чтобы изменить содержание исходного видео.

Кроме того, OmniHuman-1 также позволяет пользователям создавать новые видеоролики с использованием различных визуальных и аудиостилей, например, анимированные видеоролики, кинематографические стили или реалистичные видеоролики.

Видео создано OmniHuman-1 по запросу пользователя (Видео: ByteDance).

Пользователям нужно только указать требования к соотношению сторон, пропорциям тела (портрет, половина тела, все тело или все в одном), этот инструмент ИИ может создавать видеоролики с максимальной достоверностью, включая движения, освещение, окружающие детали...

ByteDance пока официально не представила OmniHuman-1 широкой публике, но компания поделилась образцами видеороликов, созданных с помощью этого инструмента.

На основе изображения Альберта Эйнштейна, на котором знаменитый ученый выступает с речью, был создан 23-секундный видеоролик с реалистичными движениями лица и губ.

В нескольких других коротких видеороликах, созданных OmniHuman-1, показаны люди, обладающие реалистичными жестами и выражениями лиц.

Видео презентаций персонажей, созданное OmniHuman-1 из неподвижных изображений (Видео: ByteDance).

Демонстрационные видеоролики возможностей OmniHuman-1 привели в восторг интернет-сообщество и технологический мир. Многие признают, что это самое реалистичное фейковое видео, которое они когда-либо видели.

Исследователи ByteDance заявили, что им удалось создать модель искусственного интеллекта, способную смешивать данные из изображений, видео и аудио для создания реалистичных видеороликов с пропорциями лица, телом, выражениями лица, действиями, максимально приближенными к человеческим.

Исследовательская группа заявила, что видеоролики, созданные с помощью искусственного интеллекта, имеют естественные лица, движения головы, жесты... которые соответствуют окружающим звукам и сценам, что помогает повысить «реализм» видеороликов.

ByteDance пока не сообщает, когда OmniHuman-1 станет доступен пользователям.

Видео создано OmniHuman-1 из изображений, на котором пейзаж за окном поезда реалистично меняется (Видео: ByteDance).

Появление OmniHuman-1 демонстрирует невероятные возможности инструментов искусственного интеллекта, разработанных в Китае, однако многие обеспокоены тем, что OmniHuman-1 может быть использован в вредоносных целях, например, для создания поддельных видеороликов знаменитостей с целью распространения ложной информации, мошенничества или даже создания поддельных порнографических видеороликов с целью шантажа.

Гонка в области разработки искусственного интеллекта между США и Китаем становится все более напряженной, поскольку эти две сверхдержавы постоянно внедряют инструменты искусственного интеллекта с превосходными характеристиками, чтобы побеждать своих оппонентов.

Несколько дней назад OpenAI также интегрировала новую функцию в ChatGPT, что позволяет инструменту составлять отчеты на основе огромного объема данных всего за несколько минут — задача, на выполнение которой у человека ушли бы часы.

Deepfake — это технология искусственного интеллекта, которая использует методы синтеза изображений человека для объединения и наложения изображения его лица на видео или изображение другого человека.

Deepfake пройдет «процесс обучения» на основе входных данных, чтобы создать модели и выбрать соответствующие алгоритмы для непрерывной обработки и обучения на этих моделях. После периода «обучения» технология deepfake научилась сливать лица с такой высокой точностью, что их было трудно распознать невооруженным глазом.

Источник: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm