Gemini, tên gọi mới của chatbot Bard, tạo ra hình ảnh dựa trên mô tả của người dùng theo cách tương tự như ChatGPT của OpenAI. Giống như các mô hình khác, Gemini được đào tạo để không đáp lại những lệnh nguy hiểm hoặc thù ghét và đưa sự đa dạng vào kết quả đầu ra.
Tuy nhiên, một số người dùng chỉ trích sự đa dạng này đã vượt quá giới hạn khi tạo ra hình ảnh không chính xác về con người và các nhân vật lịch sử. Chẳng hạn như vị Tổng thống đầu tiên của Mỹ George Washington bị Gemini coi là người da màu.
Các ví dụ khác bao gồm hình ảnh AI một phụ nữ Đông Nam Á mặc trang phục của giáo hoàng, trong khi thực tế, tất cả 266 giáo hoàng trong suốt lịch sử đều là đàn ông da trắng.
Google tạm dừng tính năng tạo hình ảnh AI của Gemini |
Gemini thậm chí còn tạo ra những hình ảnh “đa dạng” về lính Đức thời Đức Quốc xã, bao gồm một phụ nữ châu Á và một người đàn ông da đen mặc trang phục quân đội năm 1943.
Do Google chưa công bố các thông số chi phối hành vi của chatbot Gemini nên rất khó để có được lời giải thích rõ ràng về lý do tại sao phần mềm này lại phát minh ra nhiều phiên bản đa dạng về các nhân vật và sự kiện lịch sử.
Vấn đề của Gemini xảy ra vài ngày sau khi OpenAI, công ty vận hành ChatGPT nổi tiếng, giới thiệu một công cụ AI mới có tên Sora, có thể tạo video dựa trên mô tả bằng văn bản của người dùng.
Google trước đó đã thừa nhận rằng hành vi thất thường của chatbot cần phải được sửa chữa. Gemini có thể đã ưu tiên sự đa dạng bắt buộc trong việc tạo ra hình ảnh, dẫn đến những mô tả không chính xác về mặt lịch sử.
Google bắt đầu cung cấp tính năng tạo hình ảnh bằng mô hình AI Gemini (trước đây là Bard) từ tháng 2, nhằm cạnh tranh với OpenAI và Copilot của Microsoft. Giống như các đối thủ, công cụ này tạo ra một bộ sưu tập hình ảnh dựa trên nội dung văn bản mô tả của người dùng.