มีรายงานว่าโมเดล AI (ปัญญาประดิษฐ์) s1 ที่สร้างขึ้นโดยนักวิจัยชาวสหรัฐฯ มีต้นทุนการดำเนินการเพียง 50 เหรียญสหรัฐ แต่ให้ความสามารถในการให้เหตุผลเทียบเท่ากับโมเดล o1 ของ OpenAI ซึ่งมีราคาแพงกว่ามาก การปรากฏตัวของ S1 เกิดขึ้นหลังจากความสำเร็จที่น่าประทับใจของ DeepSeek ซึ่งสร้างความฮือฮาใน Silicon Valley ในช่วงไม่กี่วันที่ผ่านมา
สงคราม 'AI ราคาถูก' เริ่มรุนแรงขึ้นตั้งแต่มี DeepSeek
ทีมงานได้เผยแพร่ซอร์สโค้ดสำหรับ s1 สู่สาธารณะบน GitHub พร้อมกับโค้ดและข้อมูลที่ใช้สร้างโมเดล เอกสารที่ตีพิมพ์เมื่อสัปดาห์ที่แล้วได้อธิบายกระบวนการพัฒนาโมเดลนี้ พร้อมเน้นย้ำถึงเทคนิคอันชาญฉลาดที่พวกเขานำมาใช้ แทนที่จะเริ่มต้นจากศูนย์ด้วยโมเดลการใช้เหตุผลใหม่ ทีมงานได้ใช้โมเดลภาษาที่มีอยู่แล้วและดำเนินการ "ปรับแต่ง" ด้วยการกลั่นความสามารถในการใช้เหตุผลจากโมเดล Flash Thinking Experimental Gemini 2.0 ของ Google
ต้นทุนการดำเนินงานของ AI อยู่ 'ต่ำกว่า 50 เหรียญ'
การฝึกโมเดล s1 ใช้เวลาเพียง 30 นาที โดยใช้ GPU Nvidia H100 จำนวน 16 ตัว แม้ว่า GPU แต่ละตัวจะมีราคาอยู่ที่ประมาณ 25,000 เหรียญสหรัฐ แต่ค่าเช่าสำหรับกระบวนการนี้อยู่ที่ต่ำกว่า 50 เหรียญสหรัฐ ซึ่งต้องขอบคุณบริการระบบคลาวด์คอมพิวติ้ง โดยเฉพาะอย่างยิ่ง ทีมงานได้ค้นพบเคล็ดลับที่มีประโยชน์ นั่นคือ การสั่งให้โมเดล “รอ” ก่อนที่จะให้คำตอบสุดท้าย ซึ่งช่วยปรับปรุงการใช้เหตุผลและส่งผลให้ได้วิธีแก้ปัญหาที่ดีกว่า
แม้ว่า s1 จะมีความสำเร็จที่สำคัญด้วยต้นทุนต่ำ แต่ก็ยังมีข้อกังวลเกี่ยวกับการปรับขนาดของโมเดลนี้ การใช้โมเดลของ Google เป็น “ครู” ทำให้เกิดคำถามเกี่ยวกับความสามารถของ s1 ที่จะแข่งขันกับโมเดล AI ชั้นนำในปัจจุบันได้ Google น่าจะคอยจับตาดูสถานการณ์อย่างใกล้ชิด โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึงคดีความระหว่าง OpenAI และ DeepSeek ที่ยังคงดำเนินอยู่
ที่มา: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
การแสดงความคิดเห็น (0)