OpenAI เพิ่มความเข้มงวดในการควบคุมเพื่อป้องกันไม่ให้คู่แข่งคัดลอกโมเดล AI ของตน

OpenAI เพิ่งนำข้อกำหนดการยืนยันตัวตนของรัฐบาลมาใช้กับนักพัฒนาที่ต้องการเข้าถึงโมเดล AI ขั้นสูงที่สุด เพื่อที่จะ "ปกป้องทรัพย์สินทางปัญญาของบริษัท"

VietnamPlus•19/04/2025

OpenAI ได้นำข้อกำหนดการยืนยันตัวตนของรัฐบาลมาใช้กับนักพัฒนาที่ต้องการเข้าถึงโมเดลปัญญาประดิษฐ์ (AI) ขั้นสูงที่สุด ซึ่งถือเป็นการเคลื่อนไหวที่ถือเป็นการปกป้องทรัพย์สินทางปัญญาของบริษัท

OpenAI ยังไม่ได้ตอบสนองต่อคำร้องขอความคิดเห็นเกี่ยวกับข้อมูลดังกล่าว

อย่างไรก็ตาม ในการประกาศนั้น "ผู้เป็นบิดา" ของแอปพลิเคชัน ChatGPT ได้อธิบายว่าเหตุผลของกระบวนการตรวจสอบใหม่นี้เป็นเพราะนักพัฒนาบางคนจงใจใช้อินเทอร์เฟซการเขียนโปรแกรมแอปพลิเคชัน (API) ของ OpenAI จึงถือเป็นการละเมิดนโยบายการใช้งานของบริษัท

แม้ว่าเหตุผลอย่างเป็นทางการของบริษัทคือเพื่อป้องกันการละเมิด แต่การเคลื่อนไหวดังกล่าวดูเหมือนว่าจะเกิดจากความกังวลที่ลึกซึ้งกว่านั้น ซึ่งก็คือ ผลลัพธ์จากโมเดลของ OpenAI กำลังถูกเก็บรวบรวมโดยคู่แข่งเพื่อฝึกระบบ AI ของพวกเขาเอง

สิ่งนี้ได้รับการพิสูจน์จากการศึกษาวิจัยใหม่จากบริษัท Copyleaks ซึ่งเป็นบริษัทตรวจจับเนื้อหาด้วย AI

Copyleaks พบว่าผลลัพธ์ประมาณ 74% จาก DeepSeek-R1 ซึ่งเป็นโมเดลคู่แข่งของจีนจัดอยู่ในประเภทที่เขียนโดย OpenAI โดยใช้ระบบที่ระบุ “ลายนิ้วมือ” ของรูปแบบ AI ขนาดใหญ่ รูปนี้ไม่เพียงแต่แสดงให้เห็นการทำซ้ำแต่ยังแสดงให้เห็นการเลียนแบบด้วย

Copyleaks ยังได้ตรวจสอบโมเดล AI อื่นๆ เช่น phi-4 ของ Microsoft และ Grok-1 ของ xAI ด้วย ผลลัพธ์แสดงให้เห็นว่าแทบไม่มีการตกลงใดๆ กับ OpenAI โดยมีอัตรา "ไม่มีฉันทามติ" ที่ 99.3% และ 100% ตามลำดับ โมเดล Mixtral ของ Mistral มีความคล้ายคลึงกันบางประการ

การศึกษาครั้งนี้เน้นข้อเท็จจริงประการหนึ่ง: แม้ว่าแบบจำลองจะถูกขอให้เขียนด้วยโทนเสียงหรือรูปแบบที่แตกต่างกัน พวกเขาก็ยังคงทิ้งลายเซ็นสไตล์ที่ตรวจจับได้ไว้ ซึ่งคล้ายกับลายนิ้วมือทางภาษา

ลายนิ้วมือเหล่านี้ยังคงอยู่ตลอดงาน หัวข้อ และคำเตือนที่แตกต่างกัน และสามารถติดตามกลับไปยังแหล่งที่มาได้อย่างแม่นยำ

ในขณะเดียวกัน นักวิจารณ์บางคนชี้ให้เห็นว่า OpenAI เองก็สร้างโมเดลเริ่มต้นขึ้นมาด้วยการขูดข้อมูลจากเว็บ รวมถึงเนื้อหาจากผู้จัดพิมพ์ข่าว ผู้แต่ง และผู้สร้าง โดยมักจะไม่ได้รับความยินยอม

Alon Yamin ซีอีโอของ Copyleaks ชี้ให้เห็นถึงปัญหา 2 ประการ ได้แก่ การฝึกอบรมเกี่ยวกับเนื้อหาของมนุษย์ที่มีลิขสิทธิ์โดยไม่ได้รับอนุญาต และการใช้ผลลัพธ์จากระบบ AI ที่เป็นกรรมสิทธิ์ในการฝึกอบรมโมเดลที่แข่งขันกัน ซึ่งคล้ายกับการย้อนวิศวกรรมผลิตภัณฑ์ของคู่แข่ง

แม้ว่าทั้งสองแนวทางนี้จะมีความขัดแย้งทางจริยธรรม แต่การฝึกอบรมเกี่ยวกับผลลัพธ์ของ OpenAI ก่อให้เกิดความเสี่ยงในการแข่งขัน Yamin โต้แย้ง เพราะโดยพื้นฐานแล้ว การฝึกอบรมดังกล่าวจะใช้ประโยชน์จากนวัตกรรมที่ได้มาอย่างยากลำบากโดยไม่ได้รับความยินยอมหรือค่าตอบแทนจากนักพัฒนาคนแรก

ขณะที่บริษัท AI แข่งขันกันสร้างโมเดลที่มีประสิทธิภาพมากขึ้น การถกเถียงว่าใครเป็นเจ้าของข้อมูลใด และใครสามารถฝึกใช้ข้อมูลใดจึงยิ่งเข้มข้นมากขึ้น

เครื่องมือต่างๆ เช่น ระบบลายนิ้วมือดิจิทัลของ Copyleaks เป็นวิธีที่มีศักยภาพในการติดตามและตรวจยืนยันผู้ประพันธ์ในโมเดล

(เวียดนาม+)

ที่มา: https://www.vietnamplus.vn/openai-siet-chat-kiem-soat-de-ngan-cac-doi-thu-sao-chep-mo-hinh-tri-tue-nhan-tao-post1033664.vnp