บริษัทจีนเปิดตัว AI เพื่อสร้างวิดีโอปลอมที่ดูเหมือนของจริง

(Dan Tri) - ByteDance บริษัทแม่ของ TikTok สร้างความประหลาดใจให้กับทุกคนเมื่อเปิดตัวเครื่องมือ AI ที่สามารถสร้าง วิดีโอ ที่มีเนื้อหาที่สมจริงได้

ByteDance บริษัทเทคโนโลยีที่อยู่เบื้องหลังเครือข่ายโซเชียล TikTok เพิ่งเปิดตัวโมเดลปัญญาประดิษฐ์ (AI) ใหม่ที่เรียกว่า OmniHuman-1 ซึ่งมีความสามารถในการสร้างวิดีโอแอนิเมชั่นที่เหมือนจริง

ByteDance กล่าวว่า OmniHuman-1 มีพื้นฐานมาจากเทคโนโลยี Deepfake ซึ่งช่วยให้สร้างวิดีโอที่มีการเคลื่อนไหวที่นุ่มนวลเป็นอย่างยิ่ง และยากมากที่จะแยกแยะว่าเป็นผลิตภัณฑ์ของ AI ByteDance อ้างอย่างมั่นใจว่าเครื่องมือ AI ของตนสามารถสร้างผลิตภัณฑ์ที่มีคุณภาพเหนือกว่าเครื่องมือสร้างวิดีโอ AI อื่นๆ ที่มีอยู่ในปัจจุบัน

วิดีโอการพูดของ Albert Einstein ที่สร้างโดย OmniHuman-1 จากภาพของ นักวิทยาศาสตร์ (วิดีโอ: ByteDance)

ตามที่นักวิจัยของ ByteDance กล่าวไว้ OmniHuman-1 ต้องการเพียงภาพและเสียงเดียวเพื่อสร้างแบบจำลอง เช่น เสียงของบุคคลสุ่มหรือเสียงร้องเพลง จากข้อมูลนี้ เครื่องมือ AI สามารถสร้างวิดีโอที่มีความยาวตามต้องการโดยมีเสียงหรือเสียงร้องที่เหมือนกับตัวอย่างเสียง

OmniHuman-1 ยังสามารถแก้ไขและปรับเปลี่ยนวิดีโอที่มีอยู่เพื่อเปลี่ยนแปลงเนื้อหาของวิดีโอต้นฉบับได้

นอกจากนี้ OmniHuman-1 ยังช่วยให้ผู้ใช้สามารถสร้างวิดีโอใหม่ๆ ที่มีรูปแบบภาพและเสียงที่หลากหลาย เช่น วิดีโอแอนิเมชั่น หรือสไตล์ภาพยนตร์ หรือวิดีโอที่เหมือนจริง

วิดีโอสร้างโดย OmniHuman-1 ตามคำขอของผู้ใช้ (วิดีโอ: ByteDance)

ผู้ใช้เพียงแค่ระบุข้อกำหนดเกี่ยวกับอัตราส่วนภาพ อัตราส่วนร่างกาย (แนวตั้ง ครึ่งตัว เต็มตัว หรือทั้งหมดในหนึ่งเดียว) เครื่องมือ AI นี้จะสร้างวิดีโอที่มีความถูกต้องสูงสุดได้ รวมถึงการเคลื่อนไหว แสง รายละเอียดโดยรอบ...

ByteDance ยังไม่ได้เปิดตัว OmniHuman-1 อย่างเป็นทางการต่อสาธารณะ แต่บริษัทได้แบ่งปันวิดีโอตัวอย่างที่สร้างขึ้นด้วยเครื่องมือนี้

มีการสร้างวิดีโอความยาว 23 วินาทีจากรูปภาพของอัลเบิร์ต ไอน์สไตน์ ซึ่งเป็นภาพของนักวิทยาศาสตร์ชื่อดังที่บรรยายโดยมีการเคลื่อนไหวใบหน้าและริมฝีปากที่เหมือนจริง

วิดีโอสั้นๆ อีกหลายรายการที่สร้างขึ้นโดย OmniHuman-1 แสดงให้เห็นผู้คนแสดงท่าทางและการแสดงออกทางสีหน้าเหมือนจริง

วิดีโอตัวละครที่กำลังนำเสนอผลงาน สร้างขึ้นโดย OmniHuman-1 จากภาพนิ่ง (วิดีโอ: ByteDance)

วิดีโอสาธิตความสามารถของ OmniHuman-1 สร้างความทึ่งให้กับชุมชนออนไลน์และโลกแห่งเทคโนโลยี หลายๆ คนยอมรับว่านี่คือวิดีโอปลอมที่สมจริงที่สุดเท่าที่พวกเขาเคยเห็นมา

นักวิจัยของ ByteDance กล่าวว่าพวกเขาได้สร้างโมเดล AI ที่สามารถผสมผสานข้อมูลจากรูปภาพ วิดีโอ และเสียง เพื่อสร้างวิดีโอที่สมจริงด้วยสัดส่วนใบหน้า ร่างกาย การแสดงออกทางสีหน้า การกระทำ ฯลฯ ที่เหมือนมนุษย์มากที่สุด

ทีมวิจัยกล่าวว่าวิดีโอที่สร้างด้วย AI มีใบหน้าที่เป็นธรรมชาติ การเคลื่อนไหวของศีรษะ ท่าทางต่างๆ ที่สอดคล้องกับเสียงและฉากรอบๆ ช่วยเพิ่ม "ความสมจริง" ให้กับวิดีโอ

ByteDance ยังไม่ได้เปิดเผยว่า OmniHuman-1 จะพร้อมให้ผู้ใช้ใช้งานได้เมื่อใด

วิดีโอที่สร้างโดย OmniHuman-1 จากภาพ โดยมีทิวทัศน์นอกหน้าต่างรถไฟเปลี่ยนแปลงไปอย่างสมจริง (วิดีโอ: ByteDance)

การเกิดขึ้นของ OmniHuman-1 แสดงให้เห็นถึงความสามารถอันน่าเหลือเชื่อของเครื่องมือ AI ที่มาจากประเทศจีน แต่หลายคนกังวลว่า OmniHuman-1 อาจถูกนำไปใช้เพื่อจุดประสงค์ที่เป็นอันตราย เช่น การสร้างวิดีโอคนดังปลอมเพื่อแบ่งปันข้อมูลเท็จ การหลอกลวง หรือแม้กระทั่งการสร้างวิดีโอโป๊ปลอมเพื่อแบล็กเมล์

การแข่งขันพัฒนา AI กำลังเข้มข้นยิ่งขึ้นระหว่างสหรัฐอเมริกาและจีน เนื่องจากสองมหาอำนาจนี้พยายามเปิดตัวเครื่องมือ AI ที่มีฟีเจอร์เหนือกว่าอย่างต่อเนื่องเพื่อเอาชนะคู่ต่อสู้

ไม่กี่วันก่อนหน้านี้ OpenAI ยังได้รวมฟีเจอร์ใหม่เข้ากับ ChatGPT ซึ่งช่วยให้เครื่องมือนี้สามารถเขียนรายงานจากข้อมูลจำนวนมหาศาลได้ภายในเวลาเพียงไม่กี่นาที ซึ่งเป็นงานที่มนุษย์ต้องใช้เวลาหลายชั่วโมงจึงจะเสร็จ

Deepfake เป็นเทคโนโลยีปัญญาประดิษฐ์ที่ใช้เทคนิคการสังเคราะห์ภาพของบุคคลเพื่อรวมและซ้อนทับภาพใบหน้าลงบนวิดีโอหรือภาพของบุคคลอื่น

Deepfake จะดำเนินการตาม "กระบวนการเรียนรู้" โดยอาศัยข้อมูลอินพุตเพื่อสร้างโมเดล และเลือกอัลกอริทึมที่เหมาะสมเพื่อประมวลผลและเรียนรู้จากโมเดลเหล่านั้นอย่างต่อเนื่อง หลังจาก "เรียนรู้" มาระยะหนึ่ง Deepfake ก็สามารถผสานใบหน้าเข้าด้วยกันได้อย่างแม่นยำ ซึ่งยากต่อการจดจำด้วยตาเปล่า

ที่มา: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm