Người dùng có thể sử dụng Google Bard để tạo ảnh bằng mô hình chuyển văn bản thành hình ảnh Imagen 2. Bard được hỗ trợ bởi mô hình ngôn ngữ lớn Gemini Pro của Google, có thể tạo ra nhiều hình ảnh. Nhiều chuyên gia cho rằng Gemini Ultra đang được phát triển và sẽ có nhiều tính năng mạnh mẽ hơn.
Google đã khẳng định Bard là đối thủ xứng tầm với ChatGPT Plus của OpenAI, chạy GPT-4 và cho phép người dùng tạo hình ảnh nhờ tích hợp DALL-E 3. Cả hai chatbot đều hoạt động tốt, nhưng việc Bard thiếu tính năng chuyển văn bản thành hình ảnh đã mang lại cho ChatGPT Plus lợi thế hơn. Mọi người có thể sử dụng Bard cập nhật với Imagen 2 miễn phí, không giống như ChatGPT Plus, phải đăng ký và trả phí, theo The Verge.
Việc tạo hình ảnh bằng AI gần đây đã bị chỉ trích sau khi những bức ảnh khiêu dâm giả ca sĩ Taylor Swift tràn ngập trên X (trước đây là Twitter). Mặc dù vẫn chưa biết người tạo ra các bức ảnh giả mạo đó đã sử dụng nền tảng nào, nhưng một số công ty công nghệ đã khóa nền tảng tạo hình ảnh.
Google cho biết khả năng hình ảnh của Bard được “thiết kế có tính trách nhiệm”. Tính năng tạo hình mờ của công ty sẽ được đưa vào từng pixel của ảnh, điều này giúp cho người xem có thể phân biệt là ảnh được tạo bởi AI. Google cũng cho biết công ty đã triển khai các biện pháp bảo vệ an toàn và kỹ thuật để tránh tạo ra hình ảnh của những người nổi tiếng và hạn chế nội dung bạo lực, xúc phạm hoặc khiêu dâm.
Việc tạo hình ảnh sẽ không bị giới hạn ở Bard. Google đã phát hành một công cụ ảnh thử nghiệm mới được hỗ trợ bởi Imagen 2 có tên ImageFX – cho phép người dùng tạo hình ảnh bằng những lời nhắc văn bản đơn giản để có thể thử nghiệm với AI tạo sinh. Giống như Bard, tất cả ảnh được tạo thông qua ImageFX sẽ được SynthID đánh dấu và tuân theo các nguyên tắc AI cũng như rào cản kỹ thuật của Google. Hiện tại việc tạo hình ảnh chỉ thực hiện với các lệnh bằng tiếng Anh.