По данным CNBC , компания OpenAI только что представила Sora — модель ИИ нового поколения, которая работает аналогично предыдущему инструменту ИИ для генерации изображений DALL-E. Пользователи просто вводят нужную сцену, и Sora возвращает видеоклип высокого разрешения. Сора также может создавать видеоклипы на основе неподвижных изображений, расширять существующие видео или заполнять недостающие кадры.
Самоедская собака и золотистый ретривер резвятся по ночному городу, освещенному неоновыми огнями, в видео, созданном искусственным интеллектом
Создание видео может стать следующим рубежом развития творческого ИИ после того, как чат-боты и генераторы изображений не так давно появились в потребительском и деловом мире. Хотя создание контента будет интересовать энтузиастов ИИ, эти новые технологии вызывают серьезную обеспокоенность по поводу дезинформации в преддверии крупных мировых политических выборов. По данным компании Clarity, занимающейся машинным обучением, количество дипфейков, созданных с помощью искусственного интеллекта, выросло на 900% по сравнению с прошлым годом.
С помощью Sora компания OpenAI стремится составить конкуренцию инструментам искусственного интеллекта для генерации видео от таких компаний, как Google и Meta. Похожие инструменты ИИ доступны и у других стартапов, например, Stability AI с продуктом под названием Stable Video Diffusion. Amazon также запустил Create with Alexa — модель, которая специализируется на создании короткометражного анимационного контента для детей на основе команд.
В настоящее время Sora может создавать только видеоролики продолжительностью не более одной минуты. Компания OpenAI поставила перед собой цель — использовать мультимодальность (метод, объединяющий генерацию текста, изображений и видео) для предоставления более широкого набора моделей ИИ.
До сих пор Sora была доступна только небольшой группе тестировщиков безопасности, или «красным командам», которые проверяют модель на наличие уязвимостей в таких областях, как дезинформация. Компания не выпустила никаких публичных демонстраций, за исключением 10 образцов клипов, доступных на ее веб-сайте, и заявляет, что сопроводительная техническая документация будет опубликована в ближайшее время.
OpenAI также заявляет, что создает «классификатор обнаружения», который сможет идентифицировать сгенерированные Sora видеоклипы, и планирует включить в выходные данные определенные метаданные, которые помогут идентифицировать контент, созданный этим ИИ. Именно такие метаданные Meta стремится использовать для идентификации изображений, созданных с помощью ИИ.
Sora — это модель искусственного интеллекта, использующая архитектуру Transformer, которую исследователи Google представили в статье 2017 года. В своем заявлении OpenAI заявила, что Sora служит основой для моделей, которые понимают и имитируют реальный мир.
Ссылка на источник
Комментарий (0)