ChatGPT ผ่านการทดสอบที่สำคัญของการระบุตัวตนระหว่างมนุษย์กับเครื่องจักร

GPT-4.5 ของ OpenAI ถือเป็นระบบการสนทนาด้วย AI ที่มีความคล้ายกับมนุษย์มากที่สุดเท่าที่มีมา โดยเปิดโอกาสให้มีการใช้งานที่มีศักยภาพมากมายในด้านปัญญาทางสังคม

Zing News•03/04/2025

GPT-4.5 เป็นโมเดลที่ใหญ่ที่สุดที่ OpenAI เคยพัฒนามา ที่มา : The Verge .

การศึกษาใหม่จากภาควิชาวิทยาการความรู้ มหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก ถือเป็นก้าวสำคัญในสาขาปัญญาประดิษฐ์: โมเดล GPT-4.5 ของ OpenAI ประสบความสำเร็จในด้านประสิทธิภาพที่เหนือกว่าในการทดสอบทัวริงโดยใช้แนวทางการโต้ตอบที่อิงตาม "บุคลิกภาพ"

ถือเป็นระบบการสนทนาด้วย AI ที่มีความคล้ายกับมนุษย์มากที่สุดเท่าที่มีมา และเปิดโอกาสให้ประยุกต์ใช้ในด้านปัญญาทางสังคมได้มากมาย

OpenAI ยกย่อง GPT-4.5 ว่าเป็น "ก้าวสำคัญในการปรับขนาดการฝึกอบรมก่อนและหลังการฝึกอบรม" นี่เป็นโมเดลที่ใหญ่ที่สุดที่ OpenAI เคยพัฒนามา โดยมีขนาดและพลังการประมวลผลที่เหนือกว่าเวอร์ชันก่อนๆ

ตามโพสต์บล็อกอย่างเป็นทางการของ OpenAI เมื่อวันที่ 27 กุมภาพันธ์ GPT-4.5 เริ่มเปิดตัวให้กับผู้ใช้ ChatGPT Pro ในวันที่มีการประกาศ

AI สามารถหลอกมนุษย์ได้หรือไม่?

การทดลองได้เปรียบเทียบระบบ AI ที่เป็นตัวแทนสี่ระบบ ได้แก่ แชทบอท ELIZA จากยุค 1960, LLaMa-3.1-405B ของ Meta AI, GPT-4o ของ OpenAI และ GPT-4.5 ทีมได้ออกแบบการทดสอบอิสระสองครั้ง โดยมีผู้เข้าร่วมคนละ 250 คน รวมทั้งสิ้น 500 คนจากแพลตฟอร์มออนไลน์ เช่น Prolific ผู้เข้าร่วมมีความหลากหลายในเรื่องอายุ เพศ และระดับการศึกษา เพื่อให้มั่นใจว่ามีกลุ่มตัวอย่างที่หลากหลาย

ตารางเปรียบเทียบระบบ AI ทั่วไปทั้ง 4 ระบบ ที่มา: AIbase

การทดสอบใช้รูปแบบดั้งเดิมของทัวริง โดยผู้เข้าร่วมแต่ละคนจะสนทนาผ่านอินเทอร์เฟซข้อความกับผู้เข้าร่วม 2 คน (มนุษย์ 1 คน และ AI 1 คน) เป็นเวลา 5 นาที จากนั้นจึงให้คะแนนว่าใครเป็นมนุษย์

ผลลัพธ์ที่ได้น่าประหลาดใจคือ GPT-4.5 มีอัตราการ "ผ่านการทดสอบทัวริง" สูงถึง 73% ซึ่งสูงกว่าค่าเฉลี่ยของมนุษย์ (60-70%) นี่เป็นครั้งแรกที่โมเดล AI “ผ่าน” การทดสอบทัวริงมาตรฐานได้จริง ในขณะเดียวกัน คะแนน GPT-4o ลดลงเล็กน้อย LLaMa-3.1-405B ใกล้เคียงหรือไปถึงประสิทธิภาพของมนุษย์ในบางบริบท และคะแนน ELIZA ยังไม่ถึงเกณฑ์

ความสามารถในการโต้ตอบเหมือนมนุษย์

จุดเด่นของ GPT-4.5 ไม่ได้อยู่แค่ความคล่องแคล่วในการใช้ภาษาเท่านั้น แต่ยังรวมถึงความสามารถในการแสดงอารมณ์และปรับการตอบสนองต่อความแตกต่างอย่างละเอียดอ่อนของการสื่อสารของคู่สนทนาอีกด้วย ผู้เข้าร่วมจำนวนมากอธิบายว่าเป็น "เป็นมิตร" และ "แท้จริง"

โดยเฉพาะอย่างยิ่งเมื่อผู้ใช้ดูสับสนหรือเครียด GPT-4.5 สามารถตอบกลับอย่างตลกขบขันหรือให้กำลังใจ ทำให้หลายคนรู้สึกเหมือนกำลังสนทนากับคนจริงอยู่

เนื้อหาการสนทนาระหว่างผู้ทดลอง 2 คน (1 คนเป็น AI และ 1 คนเป็นมนุษย์) ในการทดสอบ ภาพถ่าย: UC San Diego

ในขณะเดียวกัน LLaMa-3.1-405B ถึงแม้จะมีประสิทธิภาพในทางเทคนิคที่น่าประทับใจ แต่มีความสามารถในการแสดงออกทางอารมณ์และการปรับตัวตามบริบทที่แย่กว่า GPT-4.5 GPT-4o มีประสิทธิภาพแต่ยังขาดความสามารถในการปรับแต่งตามความต้องการส่วนบุคคลและการปรับตัวตอบสนองต่อสถานการณ์

ความก้าวหน้าของ GPT-4.5 อาจเปิดโอกาสให้มีการใช้งานจริงได้หลากหลาย ตั้งแต่ติวเตอร์เสมือนไปจนถึงการสนับสนุนทางจิตวิทยาและการดูแลลูกค้า อย่างไรก็ตาม เนื่องจาก AI มีความคล้ายมนุษย์มากขึ้น การแยกแยะระหว่างจริงและเสมือน รวมถึงการควบคุมวิธีใช้เทคโนโลยีนี้จึงกลายเป็นความท้าทายทางสังคมที่สำคัญ

การศึกษาดังกล่าวเกิดขึ้นท่ามกลางการพัฒนาอย่างรวดเร็วของ AI ความสำเร็จของ GPT-4.5 ไม่เพียงแต่เป็นชัยชนะทางเทคนิคสำหรับ OpenAI เท่านั้น แต่ยังได้ตั้งคำถามเชิงลึกเกี่ยวกับความสัมพันธ์ระหว่างมนุษย์และเครื่องจักรอีกด้วย ผู้เข้าร่วมการทดสอบรายหนึ่งแสดงความคิดเห็นว่ารู้สึกเหมือนกำลังคุยกับเพื่อน จนกระทั่งเขาตระหนักว่ามันเป็นเพียงบรรทัดโค้ดเท่านั้น การสนทนาระหว่างมนุษย์กับ AI อาจเพิ่งเริ่มต้นเท่านั้น

ที่มา: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html