(CLO) Google เพิ่งเปิดตัวเครื่องมือปัญญาประดิษฐ์ (AI) ใหม่ที่เรียกว่า "Whisk" ซึ่งช่วยให้ผู้ใช้สามารถอัปโหลดภาพถ่ายเพื่อค้นหาภาพรวมที่สร้างโดย AI แม้ว่าผู้ใช้จะไม่ได้ป้อนข้อความใดๆ ก็ตาม
Whisk ใช้ AI ในการผสมผสานเรื่องราว บริบท และสไตล์ของรูปภาพที่อัพโหลด เพื่อสร้างรูปภาพใหม่ที่ไม่ซ้ำใครมากขึ้น
Google อธิบายว่า Whisk เป็น "เครื่องมือสร้างสรรค์" ที่ช่วยให้ผู้ใช้สามารถสร้างสรรค์ไอเดียภาพใหม่ๆ ได้อย่างรวดเร็ว โดยไม่จำเป็นต้องมีความสามารถในการแก้ไขภาพแบบมืออาชีพ ตามที่ Google ระบุ เครื่องมือนี้ไม่ใช่โปรแกรมแก้ไขรูปภาพแบบดั้งเดิม แต่เป็นเครื่องมือ AI ที่สนุกสนานซึ่งมีจุดมุ่งหมายเพื่อกระตุ้นความคิดสร้างสรรค์และการค้นพบที่รวดเร็ว
เมื่อผู้ใช้ทำการอัปโหลดรูปถ่าย Whisk จะใช้บริการ AI ของ Google, Gemini และเทคโนโลยี Imagen 3 ร่วมกัน ซึ่งเป็นเครื่องมือที่สร้างภาพจากข้อความที่ Google ได้รับมาจาก DeepMind
Gemini จะวิเคราะห์ภาพถ่ายและสร้างคำบรรยาย จากนั้น Imagen 3 จะรวมองค์ประกอบต่างๆ ของภาพถ่ายนั้นเข้าด้วยกันในรูปแบบที่สร้างสรรค์ โดยคง "แก่นแท้" ของภาพถ่ายเอาไว้ แทนที่จะคัดลอกมาแบบเป๊ะๆ
อินเทอร์เฟซเครื่องมือตีไข่ ภาพหน้าจอ
ซึ่งหมายความว่าผลลัพธ์สุดท้ายอาจไม่เหมือนกับภาพต้นฉบับ 100% ตัวอย่างเช่น ความสูง ทรงผม หรือสีผิวของแบบในภาพใหม่อาจแตกต่างจากต้นฉบับ อย่างไรก็ตาม ผู้ใช้ยังสามารถปรับแต่งข้อมูลอินพุต เปลี่ยนบริบท สไตล์ หรือรวมธีมต่างๆ เพื่อสร้างรูปภาพที่แตกต่างกันได้
Whisk สามารถสร้างภาพได้ไม่เพียงแค่จากข้อความเท่านั้น แต่ยังสามารถสร้างภาพจากรูปภาพต้นฉบับได้อีกด้วย ขยายขอบเขตความคิดสร้างสรรค์โดยที่ผู้ใช้ไม่จำเป็นต้องมีประสบการณ์ในการแก้ไขภาพ Thomas Iljic ผู้อำนวยการฝ่ายบริหารผลิตภัณฑ์ของ Google Labs กล่าวว่า "Whisk ได้รับการออกแบบมาเพื่อช่วยให้ผู้ใช้สามารถผสมผสานเรื่องราว บริบท และสไตล์ต่างๆ ในรูปแบบที่สร้างสรรค์ ช่วยให้ผู้ใช้สามารถสำรวจด้วยภาพได้แทนที่จะต้องแก้ไขแต่ละพิกเซลอย่างพิถีพิถัน"
แม้ว่า Whisk จะยังอยู่ในช่วงเริ่มต้นของการพัฒนา แต่เครื่องมือนี้ได้เปิดตัวเป็นเว็บไซต์บน Google Labs และปัจจุบันก็พร้อมให้ผู้ใช้ในสหรัฐอเมริกาใช้งานแล้ว
Dan Ives กรรมการผู้จัดการและนักวิเคราะห์อาวุโสของ Wedbush Securities กล่าวว่า Whisk ถือเป็น “ช่วงเวลาแสดงพลัง” อีกครั้งของ Google ในการแข่งขันด้านเทคโนโลยี
นอกจากนี้ ไอฟส์ยังตั้งข้อสังเกตว่า DeepMind ซึ่งเป็นห้องทดลองด้าน AI ที่ Google เข้าซื้อกิจการในปี 2014 ถือเป็นสินทรัพย์สำคัญที่ช่วยให้ Google รักษาตำแหน่งในสาขา AI ไว้ได้ ผลิตภัณฑ์ AI รวมถึง Whisk เป็นส่วนสำคัญของกลยุทธ์การพัฒนาผลิตภัณฑ์ของ Google ในอีกไม่กี่ปีข้างหน้า โดยคาดว่าจะมีผลิตภัณฑ์ใหม่หลายรายการเปิดตัวภายในปี 2025
เครื่องมือ Whisk เปิดช่องทางใหม่ๆ ในการใช้ AI เพื่อสร้างสรรค์ผลิตภัณฑ์นวัตกรรมโดยไม่ต้องให้ผู้ใช้มีส่วนร่วมมากนัก สิ่งนี้แสดงถึงความก้าวหน้าของ AI ในการทำความเข้าใจและการรวมองค์ประกอบภาพอย่างสร้างสรรค์
Whisk เป็นส่วนหนึ่งของกระแสที่กำลังเติบโตในกลุ่มบริษัทเทคโนโลยีรายใหญ่ๆ รวมถึง Google และ OpenAI ในการพัฒนาเครื่องมือ AI สำหรับผู้บริโภค เครื่องมือเหล่านี้มีไว้เพื่อมอบประสบการณ์สร้างสรรค์ใหม่ๆ ตั้งแต่การสร้างรูปภาพ ข้อความ ไปจนถึงวิดีโอ เมื่อเร็วๆ นี้ OpenAI ได้เปิดตัวเครื่องสร้างข้อความเป็นวิดีโอที่เรียกว่า Sora ซึ่งเป็นคู่แข่งโดยตรงกับ Whisk
ง็อก อันห์ (ตามรายงานของ CNN, The Verge, ZDNET)
ที่มา: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
การแสดงความคิดเห็น (0)