OpenAI запускает инструмент для создания текстовых видео

По данным CNBC , компания OpenAI только что представила Sora — модель ИИ нового поколения, которая работает аналогично предыдущему инструменту ИИ для генерации изображений DALL-E. Пользователи просто вводят нужную сцену, и Sora возвращает видеоклип высокого разрешения. Сора также может создавать видеоклипы на основе неподвижных изображений, расширять существующие видео или заполнять недостающие кадры.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Самоедская собака и золотистый ретривер резвятся по ночному городу, освещенному неоновыми огнями, в видео, созданном искусственным интеллектом

Создание видео может стать следующим рубежом развития творческого ИИ после того, как чат-боты и генераторы изображений не так давно появились в потребительском и деловом мире. Хотя создание контента будет интересовать энтузиастов ИИ, эти новые технологии вызывают серьезную обеспокоенность по поводу дезинформации в преддверии крупных мировых политических выборов. По данным компании Clarity, занимающейся машинным обучением, количество дипфейков, созданных с помощью искусственного интеллекта, выросло на 900% по сравнению с прошлым годом.

С помощью Sora компания OpenAI стремится составить конкуренцию инструментам искусственного интеллекта для генерации видео от таких компаний, как Google и Meta. Похожие инструменты ИИ доступны и у других стартапов, например, Stability AI с продуктом под названием Stable Video Diffusion. Amazon также запустил Create with Alexa — модель, которая специализируется на создании короткометражного анимационного контента для детей на основе команд.

В настоящее время Sora может создавать только видеоролики продолжительностью не более одной минуты. Компания OpenAI поставила перед собой цель — использовать мультимодальность (метод, объединяющий генерацию текста, изображений и видео) для предоставления более широкого набора моделей ИИ.

До сих пор Sora была доступна только небольшой группе тестировщиков безопасности, или «красным командам», которые проверяют модель на наличие уязвимостей в таких областях, как дезинформация. Компания не выпустила никаких публичных демонстраций, за исключением 10 образцов клипов, доступных на ее веб-сайте, и заявляет, что сопроводительная техническая документация будет опубликована в ближайшее время.

OpenAI также заявляет, что создает «классификатор обнаружения», который сможет идентифицировать сгенерированные Sora видеоклипы, и планирует включить в выходные данные определенные метаданные, которые помогут идентифицировать контент, созданный этим ИИ. Именно такие метаданные Meta стремится использовать для идентификации изображений, созданных с помощью ИИ.

Sora — это модель искусственного интеллекта, использующая архитектуру Transformer, которую исследователи Google представили в статье 2017 года. В своем заявлении OpenAI заявила, что Sora служит основой для моделей, которые понимают и имитируют реальный мир.

Ссылка на источник