เครื่องสร้างภาพ AI ทำงานอย่างไร?
เครื่องสร้างรูปภาพที่ใช้ AI จะใช้โมเดลการเรียนรู้ของเครื่อง ซึ่งจะนำข้อความที่ผู้ใช้ป้อนและสร้างรูปภาพหนึ่งภาพหรือมากกว่านั้นที่ตรงกับคำอธิบาย การฝึกโมเดลเหล่านี้ต้องใช้ชุดข้อมูลขนาดใหญ่ที่มีรูปภาพนับล้านภาพ
การสร้างภาพด้วย AI กำลังเป็นเรื่องง่ายขึ้น ภาพ: อิจเน็ต
แม้ว่า Midjourney หรือ DALL-E 2 จะไม่ได้เปิดเผยต่อสาธารณะว่าอัลกอริทึมของพวกมันทำงานอย่างไร แต่เครื่องสร้างภาพ AI ส่วนใหญ่จะใช้กระบวนการที่เรียกว่าการแพร่กระจาย แบบจำลองการแพร่กระจายทำงานโดยการเพิ่ม "สัญญาณรบกวน" แบบสุ่มลงในข้อมูลฝึก จากนั้นเรียนรู้การสร้างข้อมูลขึ้นมาใหม่โดยการลบส่วนที่มีสัญญาณรบกวนเหล่านี้ออกไป โมเดลจะทำซ้ำขั้นตอนนี้จนกว่าจะพบรูปภาพที่ตรงกับอินพุต
ซึ่งแตกต่างจากโมเดลภาษาขนาดใหญ่เช่น ChatGPT โมเดลภาษาขนาดใหญ่ได้รับการฝึกอบรมบนข้อมูลข้อความที่ไม่มีป้ายกำกับ ซึ่งจะถูกวิเคราะห์เพื่อเรียนรู้รูปแบบภาษาและสร้างการตอบสนองแบบมนุษย์
โดยทั่วไป AI อินพุตจะส่งผลต่อเอาต์พุต หากผู้ใช้ระบุว่าต้องการรวมเฉพาะบุคคลที่มีสีผิวหรือเพศที่กำหนดไว้ในรูปภาพ โมเดลจะนำข้อนี้มาพิจารณา
อย่างไรก็ตาม นอกเหนือจากนี้ โมเดลยังมีแนวโน้มที่จะส่งคืนรูปภาพบางภาพโดยค่าเริ่มต้นอีกด้วย โดยส่วนใหญ่แล้วเป็นผลมาจากการขาดความหลากหลายในข้อมูลการฝึกอบรม
การศึกษาเมื่อเร็วๆ นี้สำรวจถึงวิธีที่ Midjourney สร้างภาพคำศัพท์ที่ดูเหมือนทั่วไป เช่น อาชีพสื่อเฉพาะทาง (เช่น "นักวิเคราะห์ข่าว" "ผู้วิจารณ์ข่าว" และ "ผู้ตรวจสอบข้อเท็จจริง") และอาชีพทั่วไปอื่นๆ (เช่น "นักข่าว" "นักข่าว" "นักสื่อสารมวลชน")
การศึกษาดังกล่าวดำเนินการตั้งแต่เดือนสิงหาคมปีที่แล้ว และดำเนินการซ้ำผลการศึกษาอีกครั้งหลังจาก 6 เดือน เพื่อทบทวนความคืบหน้าของระบบในช่วงเวลาดังกล่าว โดยรวมแล้ว นักวิจัยได้วิเคราะห์ภาพที่สร้างโดย AI มากกว่า 100 ภาพในช่วงเวลาดังกล่าว
การเลือกปฏิบัติทางอายุและการเลือกปฏิบัติทางเพศ
สำหรับอาชีพเฉพาะ ผู้สูงอายุจะเป็นเพศชายเสมอ ภาพ: IJN
สำหรับชื่อตำแหน่งงานที่ไม่เฉพาะเจาะจง Midjourney จะแสดงเฉพาะภาพของผู้ชายและผู้หญิงที่อายุน้อยกว่าเท่านั้น สำหรับบทบาทเฉพาะทางนั้นจะมีการแสดงทั้งคนหนุ่มสาวและคนสูงอายุ แต่คนที่อายุมากกว่าจะเป็นผู้ชายเสมอ
ผลลัพธ์เหล่านี้เสริมความคิดแบบแผนโดยปริยายหลายประการ รวมถึงการสันนิษฐานว่าผู้สูงอายุไม่ทำงานในตำแหน่งที่ไม่เฉพาะทาง เฉพาะผู้ชายสูงอายุเท่านั้นที่เหมาะกับงานเฉพาะทาง และงานที่ไม่ค่อยเฉพาะทางมักจะสงวนไว้สำหรับผู้หญิง
ยังมีข้อแตกต่างที่เห็นได้ชัดในวิธีการแนะนำผู้ชายและผู้หญิง ตัวอย่างเช่น ผู้หญิงจะดูเด็กกว่าและไม่มีริ้วรอย ขณะที่ผู้ชาย “สามารถ” มีริ้วรอยได้
นอกจากนี้ AI ยังดูเหมือนจะแสดงเพศเป็นแบบไบนารี แทนที่จะแสดงตัวอย่างการแสดงออกทางเพศที่คลุมเครือมากขึ้น
อคติทางเชื้อชาติ
รูปภาพสำหรับ "นักข่าว" หรือ "นักข่าว" มักจะแสดงภาพเฉพาะคนผิวขาวเท่านั้น ภาพ: IJN
รูปภาพทั้งหมดที่แสดงด้วยคำเช่น "นักข่าว" "นักข่าว" จะแสดงเฉพาะรูปภาพของคนผิวขาวเท่านั้น
สิ่งนี้อาจสะท้อนถึงการขาดความหลากหลายและการนำเสนอที่ไม่เพียงพอในข้อมูลการฝึกอบรมพื้นฐานของ AI
ความเป็นชนชั้นและการอนุรักษ์นิยม
ตัวละครทั้งหมดในภาพยังมีรูปลักษณ์ที่ "อนุรักษ์นิยม" อีกด้วย ตัวอย่างเช่น ไม่มีใครมีรอยสัก การเจาะผม ทรงผมแปลกๆ หรือคุณลักษณะอื่นใดที่อาจทำให้ตนแตกต่างจากคำอธิบายแบบดั้งเดิม
หลายๆ คนยังสวมเสื้อผ้าที่เป็นทางการ เช่น เสื้อเชิ้ตและชุดสูท สิ่งเหล่านี้คือสัญญาณของความคาดหวังของชั้นเรียน แม้ว่าเครื่องแต่งกายนี้อาจเหมาะสมกับบทบาทบางบทบาท เช่น พิธีกรรายการโทรทัศน์ แต่ก็ไม่ได้สะท้อนถึงการแต่งกายของนักข่าวหรือผู้รายงานข่าวโดยทั่วไป
การวางผังเมือง
ภาพทั้งหมดจะถูกตั้งค่าในเมืองตามค่าเริ่มต้น แม้ว่าจะไม่มีการอ้างอิงทางภูมิศาสตร์ก็ตาม ภาพ: IJN
แม้จะไม่ได้ระบุตำแหน่งหรือบริบททางภูมิศาสตร์ใดๆ แต่รูปภาพที่ AI ส่งคืนมาก็รวมถึงพื้นที่ในเมือง เช่น ตึกระฟ้า หรือย่านที่พลุกพล่าน นี่ไม่เป็นความจริง เพราะประชากรโลกมากกว่าครึ่งหนึ่งอาศัยอยู่ในเมือง
ล้าสมัย
ภาพของบุคลากรด้านสื่อรวมถึงเทคโนโลยีที่ล้าสมัย เช่น เครื่องพิมพ์ดีด เครื่องพิมพ์ และกล้องถ่ายรูปรุ่นวินเทจ
เนื่องจากผู้เชี่ยวชาญหลายคนมีหน้าตาเหมือนกันในปัจจุบัน AI จึงดูเหมือนว่าจะดึงเทคโนโลยีที่แตกต่างกันมากขึ้น (รวมถึงเทคโนโลยีที่ล้าสมัยและไม่ได้ใช้งาน) เพื่อทำให้บทบาทที่ได้รับการอธิบายไว้ชัดเจนยิ่งขึ้น
ดังนั้นหากคุณกำลังสร้างภาพ AI ของตัวเอง โปรดพิจารณาถึงอคติที่อาจเกิดขึ้นได้เมื่อเขียนคำอธิบาย มิฉะนั้น คุณอาจกำลังเสริมสร้างอคติที่ไม่เป็นมิตรโดยไม่ได้ตั้งใจ ซึ่งสังคมได้พยายามขจัดมาหลายสิบปี
ฮวง ตัน (ตาม IJN)
แหล่งที่มา
การแสดงความคิดเห็น (0)