OpenAI vừa cho ra mắt phiên bản thứ ba của nền tảng AI tạo sinh Dall-E, cho phép người dùng sử dụng chatbot ChatGPT để tạo ra hình ảnh từ lời nhắc (prompt).
Dall-E là một công cụ chuyển đổi prompt từ văn bản sang hình ảnh. Với phiên bản thứ ba vừa ra mắt, những nhà nghiên cứu của OpenAI cho biết công cụ hiểu bối cảnh tốt hơn, không bỏ qua các từ cụ thể như phiên bản trước.
Điều đáng chú ý là Dall-E 3 được tích hợp với ChatGPT. Giờ đây người dùng không phải nghĩ ra lời nhắc chi tiết cho Dall-E 3 nữa mà chỉ cần yêu cầu chatbot ChatGPT đưa ra lời nhắc thay mình. Người dùng cũng có thể sử dụng lời nhắc riêng nếu họ có ý tưởng cụ thể dành cho Dall-E.
Hình ảnh cho Dall-E 3 tạo ra. |
Dall-E được OpenAI cho ra mắt lần đầu vào tháng 1/2021, trước những nền tảng khác như Midjourney. Với phiên bản hai vào năm 2022, OpenAI mở danh sách chờ để kiểm soát người nào được sử dụng công cụ sau khi nhận chỉ trích Dall-E tạo ra hình ảnh có định kiến. Tháng 9 cùng năm, công ty Mỹ đã bỏ danh sách chờ và mở Dall-E 2 cho công chúng.
Dall-E 3 sẽ được phát hành cho người dùng ChatGPT Plus và ChatGPT Enterprise trước tiên vào tháng 10 tới đây, sau đó là những phòng nghiên cứu và dịch vụ API. Phiên bản miễn phí dành cho mọi người vẫn chưa được công bố.
OpenAI khẳng định đã bỏ ra nhiều công sức cho Dall-E 3 nhằm tạo ra những biện pháp an toàn mạnh mẽ để ngăn chặn việc tạo ra các hình ảnh thù địch. Công ty cũng đã hợp tác với “quân đỏ” bên ngoài – các nhóm cố tình phá một hệ thống để kiểm tra độ an toàn – và dựa vào phân loại đầu vào (một cách để dạy cho mô hình ngôn ngữ bỏ qua các từ nhất định để tránh lời nhắc bạo lực, khiêu khích). Dall-E 3 cũng sẽ không thể tạo hình ảnh những nhân vật của công chúng nếu lời nhắc đề cập một cái tên cụ thể.
Trong một email, đại diện của OpenAI cho biết Dall-E 3 đã được đào tạo để không tạo các hình ảnh mang phong cách của những nghệ sỹ còn sống, khác so với Dall-E 2.