OpenAI ra mắt công cụ sáng tạo video bằng văn bản

Theo CNBC, OpenAI vừa giới thiệu Sora - mô hình AI thế hệ mới hoạt động tương tự như công cụ AI tạo hình ảnh DALL-E của họ trước đó. Người dùng chỉ cần nhập cảnh mong muốn và Sora sẽ trả về một video clip có độ phân giải cao. Sora cũng có thể tạo các video clip lấy cảm hứng từ hình ảnh tĩnh và mở rộng các video hiện có hoặc điền vào các khung hình còn thiếu.

Sáng tạo video có thể là bước tiến tiếp theo cho AI sáng tạo sau khi các chatbot và trình tạo hình ảnh đã xâm nhập vào thế giới tiêu dùng và kinh doanh cách nay không lâu. Mặc dù việc sáng tạo nội dung sẽ kích thích những người đam mê AI, tuy nhiên các công nghệ mới này đang gây ra mối lo ngại nghiêm trọng về thông tin sai lệch khi các cuộc bầu cử chính trị lớn trên toàn cầu đang đến gần. Theo dữ liệu từ công ty máy học Clarity, số lượng deepfake do AI tạo ra đã tăng 900% so với năm trước.

Với Sora, OpenAI đang tìm cách cạnh tranh với các công cụ AI tạo video từ các công ty như Google và Meta. Các công cụ AI tương tự cũng có sẵn từ các startup khác, chẳng hạn như Stability AI với sản phẩm có tên Stable Video Diffusion. Amazon cũng đã phát hành Create with Alexa - một mô hình chuyên tạo nội dung hoạt hình dạng ngắn dành cho trẻ em dựa trên lệnh.

Sora hiện bị giới hạn trong việc tạo các video dài một phút hoặc ít hơn. OpenAI đã biến tính đa phương thức, một phương thức kết hợp giữa tạo văn bản, hình ảnh và video, thành mục tiêu trong nỗ lực cung cấp một bộ mô hình AI rộng hơn.

Cho đến nay, Sora chỉ được cung cấp cho một nhóm nhỏ những người thử nghiệm an toàn, hay còn gọi là "đội đỏ" nhằm kiểm tra mô hình để tìm lỗ hổng trong các lĩnh vực như thông tin sai lệch. Công ty chưa phát hành bất kỳ bản trình diễn công khai nào ngoài 10 clip mẫu có sẵn trên trang web của mình và cho biết tài liệu kỹ thuật đi kèm sẽ sớm được phát hành.

OpenAI cũng cho biết họ đang xây dựng một "bộ phân loại phát hiện" có thể xác định các video clip do Sora tạo và họ có kế hoạch đưa một số siêu dữ liệu nhất định vào đầu ra để giúp xác định nội dung do AI này sáng tạo ra. Đó chính là loại siêu dữ liệu mà Meta đang tìm cách sử dụng để xác định các hình ảnh do AI tạo ra.

Được biết, Sora là mô hình AI sử dụng kiến trúc Transformer mà các nhà nghiên cứu của Google giới thiệu trong một bài báo vào năm 2017. Trong thông báo của mình, OpenAI nói Sora đóng vai trò là nền tảng cho các mô hình hiểu và mô phỏng thế giới thực.

Source link