คำเตือนเกี่ยวกับ 'ภาพหลอน' ของ ChatGPT

การศึกษาล่าสุดแสดงให้เห็นว่า GPT o3 และ o4-mini ซึ่งเป็นโมเดลที่มีประสิทธิภาพที่สุดในพอร์ตโฟลิโอของ OpenAI กำลังสร้างข้อมูลเท็จมากขึ้นกว่าเดิมด้วยซ้ำ

Zing News•20/04/2025

โมเดล ChatGPT สองรุ่นที่เปิดตัวใหม่มีความถี่ในการปลอมแปลงข้อมูลสูงกว่ารุ่นก่อนหน้า ภาพ : หิ่งห้อย .

เพียงสองวันหลังจากการประกาศ GPT-4.1 OpenAI ได้เปิดตัวโมเดลใหม่ไม่ใช่หนึ่ง แต่ถึงสองโมเดลอย่างเป็นทางการ เรียกว่า o3 และ o4-mini ทั้งสองโมเดลนี้แสดงให้เห็นความสามารถในการอนุมานอันเหนือกว่าพร้อมกับการปรับปรุงที่ทรงพลังมากมาย

อย่างไรก็ตาม ตามรายงานของ TechCrunch นางแบบรุ่นใหม่ทั้งสองคนนี้ยังคงประสบปัญหา "ภาพหลอน" หรือข้อมูลที่สร้างขึ้นเอง พวกมันยัง "เกิดภาพหลอน" มากกว่าโมเดลเก่าๆ ของ OpenAI บางรุ่นด้วยซ้ำ

ตามที่ IBM ระบุ ภาพหลอนเกิดขึ้นเมื่อโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งโดยทั่วไปเป็นแชทบอทหรือเครื่องมือวิทัศน์คอมพิวเตอร์ ได้รับรูปแบบข้อมูลที่ไม่มีอยู่จริงหรือมนุษย์ไม่สามารถจดจำได้ ส่งผลให้ได้ผลลัพธ์ที่ไม่มีความหมายหรือเข้าใจผิดได้

กล่าวอีกนัยหนึ่ง ผู้ใช้มักขอให้ AI สร้างผลลัพธ์ที่แม่นยำโดยอิงจากข้อมูลการฝึกอบรม อย่างไรก็ตาม ในบางกรณี ผลลัพธ์ของ AI ไม่ได้ขึ้นอยู่กับข้อมูลที่แม่นยำ ทำให้เกิดการตอบสนองที่ "ลวงตา"

ในรายงานล่าสุด OpenAI พบว่า o3 "เกิดภาพหลอน" เมื่อตอบคำถาม 33% ใน PersonQA ซึ่งเป็นเกณฑ์มาตรฐานภายในของบริษัทในการวัดความแม่นยำของความรู้ของโมเดลเกี่ยวกับมนุษย์

เมื่อเปรียบเทียบแล้ว นี่เป็นสองเท่าของอัตรา "ภาพหลอน" ของโมเดลการใช้เหตุผลก่อนหน้านี้ของ OpenAI ซึ่งคือ o1 และ o3-mini ซึ่งอยู่ที่ 16% และ 14.8% ตามลำดับ ในขณะเดียวกัน โมเดล O4-mini ทำได้แย่กว่าใน PersonQA โดยประสบกับ "อาการประสาทหลอน" สูงถึง 48% ของระยะเวลาการทดสอบ

ที่น่ากังวลยิ่งกว่านั้นคือ “บิดาแห่ง ChatGPT” ไม่รู้จริงๆ ว่าเหตุใดเหตุการณ์นี้จึงเกิดขึ้น โดยเฉพาะในรายงานทางเทคนิคเกี่ยวกับ o3 และ o4-mini OpenAI เขียนว่า "จำเป็นต้องมีการวิจัยเพิ่มเติมเพื่อทำความเข้าใจว่าเหตุใด 'ภาพลวงตา' จึงแย่ลง" เมื่อมีการปรับขนาดโมเดลการใช้เหตุผล

o3 และ o4-mini ทำงานได้ดีขึ้นในบางพื้นที่ รวมถึงการเขียนโปรแกรมและงานที่เกี่ยวข้องกับคณิตศาสตร์ อย่างไรก็ตาม เนื่องจากมีความจำเป็นต้อง "เสนอข้อเรียกร้องมากกว่าการสรุปทั่วไป" ทั้งสองโมเดลจึงประสบปัญหาในการสร้างผลลัพธ์ที่ "รวมถึงข้อเรียกร้องที่แม่นยำยิ่งขึ้น แต่ก็รวมถึงข้อเรียกร้องที่ไม่แม่นยำมากขึ้นด้วยเช่นกัน"

ที่มา: https://znews.vn/canh-bao-ve-chatgpt-ao-giac-post1547242.html