(Дэн Три) - ByteDance, материнская компания TikTok, удивила всех, представив инструмент на основе искусственного интеллекта, способный создавать видеоролики с реалистичным контентом.
ByteDance, технологическая компания, стоящая за социальной сетью TikTok, только что представила новую модель искусственного интеллекта (ИИ) под названием OmniHuman-1, способную создавать реалистичные анимированные видеоролики.
ByteDance заявила, что OmniHuman-1 основан на технологии deepfake, позволяющей создавать видеоролики с чрезвычайно плавными движениями, и очень сложно распознать, что это продукт искусственного интеллекта. ByteDance уверенно заявляет, что ее движок ИИ может создавать продукты более высокого качества по сравнению с другими существующими инструментами ИИ для создания видео.
Видеозапись выступления Альберта Эйнштейна, созданная OmniHuman-1 на основе изображения ученого (Видео: ByteDance).
По словам исследователей ByteDance, для моделирования OmniHuman-1 достаточно одного изображения и звука, например, голоса случайного человека или поющего голоса. На основе этих данных инструмент ИИ может генерировать видеоролики произвольной длины с голосами или вокалом, идентичными образцу аудио.
OmniHuman-1 также может редактировать и изменять существующие видео, изменяя содержание исходного видео.
Кроме того, OmniHuman-1 также позволяет пользователям создавать новые видеоролики с использованием различных визуальных и аудиостилей, например, анимированные видеоролики, кинематографические стили или реалистичные видеоролики.
Видео создано OmniHuman-1 по запросу пользователя (Видео: ByteDance).
Пользователям нужно только указать требования к соотношению сторон, пропорциям тела (портрет, половина тела, все тело или все в одном), этот инструмент ИИ может создавать видеоролики с максимальной достоверностью, включая движения, освещение, окружающие детали...
ByteDance пока официально не представила OmniHuman-1 публике, но компания поделилась образцами видеороликов, созданных с помощью этого инструмента.
На основе изображения Альберта Эйнштейна, на котором знаменитый ученый выступает с речью, был создан 23-секундный видеоролик с реалистичными движениями лица и губ.
В нескольких других коротких видеороликах, созданных OmniHuman-1, показаны люди, обладающие реалистичными жестами и выражениями лиц.
Видео презентаций персонажей, созданное OmniHuman-1 из неподвижных изображений (Видео: ByteDance).
Демонстрационные видеоролики возможностей OmniHuman-1 привели в восторг интернет-сообщество и мир технологий. Многие признают, что это самое реалистичное фейковое видео, которое они когда-либо видели.
Исследователи ByteDance заявили, что им удалось создать модель искусственного интеллекта, способную смешивать данные из изображений, видео и аудио для создания реалистичных видеороликов с пропорциями лица, телом, выражениями лица, действиями, максимально приближенными к человеческим.
Исследовательская группа заявила, что видеоролики, созданные с помощью искусственного интеллекта, имеют естественные лица, движения головы, жесты... которые соответствуют окружающим звукам и сценам, что помогает повысить «реализм» видеороликов.
ByteDance пока не сообщает, когда OmniHuman-1 станет доступен пользователям.
Видео создано OmniHuman-1 из изображений, на котором пейзаж за окном поезда реалистично меняется (Видео: ByteDance).
Появление OmniHuman-1 демонстрирует невероятные возможности инструментов искусственного интеллекта, разработанных в Китае, однако многие обеспокоены тем, что OmniHuman-1 может быть использован в вредоносных целях, например, для создания поддельных видеороликов знаменитостей с целью распространения ложной информации, мошенничества или даже создания поддельных порнографических видеороликов с целью шантажа.
Гонка в области разработки искусственного интеллекта между США и Китаем становится все более напряженной, поскольку две сверхдержавы постоянно внедряют инструменты искусственного интеллекта с превосходными характеристиками, чтобы побеждать своих оппонентов.
Несколько дней назад OpenAI также интегрировала новую функцию в ChatGPT, что позволяет инструменту составлять отчеты на основе огромного объема данных всего за несколько минут — задача, на выполнение которой у человека ушли бы часы.
Deepfake — это технология искусственного интеллекта, которая использует методы синтеза изображений человека для объединения и наложения изображения лица на видео или изображение другого человека.
Deepfake пройдет «процесс обучения» на основе входных данных, чтобы создать модели и выбрать соответствующие алгоритмы для непрерывной обработки и обучения на этих моделях. После периода «обучения» технология deepfake смогла совмещать лица с такой высокой точностью, что их было трудно распознать невооруженным глазом.
Источник: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm
Комментарий (0)