ยักษ์ใหญ่ในวงการปัญญาประดิษฐ์ (AI) ยอมรับความสำเร็จของ DeepSeek บริษัทสตาร์ทอัพจีน แต่บอกว่าความสำเร็จของบริษัทไม่ควรเกินจริง
ตั้งแต่ซีอีโอของ OpenAI นาย Sam Altman จนถึงนักวิทยาศาสตร์ของ Google นาย Andrew Ng จิตใจด้าน AI ที่ยอดเยี่ยมที่สุดในโลกต่างชื่นชมแนวทางโอเพนซอร์สของ DeepSeek หลังจากที่สตาร์ทอัพจีนรายนี้เปิดตัวโมเดล AI ที่ล้ำสมัยสองโมเดล
บริษัทที่มีฐานอยู่ในเมืองหางโจวสร้างความประหลาดใจให้กับอุตสาหกรรม AI ทั่วโลกด้วยโมเดลการใช้เหตุผลโอเพนซอร์ส R1
โมเดลดังกล่าวซึ่งเปิดตัวเมื่อวันที่ 20 มกราคม แสดงให้เห็นประสิทธิภาพที่เทียบเคียงได้กับโมเดลแบบปิดจาก OpenAI ซึ่งเป็นผู้พัฒนา ChatGPT แต่มีต้นทุนในการฝึกอบรมที่ต่ำกว่ามาก
DeepSeek V3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่พื้นฐาน ได้รับการเปิดตัวเมื่อไม่กี่สัปดาห์ที่ผ่านมา และมีค่าใช้จ่ายในการฝึกอบรมเพียง 5.5 ล้านดอลลาร์เท่านั้น ตามที่ DeepSeek ระบุ
การประกาศของบริษัททำให้เกิดคำถามว่าบริษัทเทคโนโลยีกำลังใช้จ่ายเกินตัวสำหรับชิปกราฟิก (GPU) สำหรับการฝึกอบรม AI หรือไม่ จนทำให้เกิดการเทขายหุ้นเทคโนโลยีที่เกี่ยวข้อง
สัปดาห์ที่แล้ว ในกระทู้ “Ask Me Anything” บน Reddit Altman โต้แย้งว่า OpenAI ผิด และจำเป็นต้องหาวิธีอื่นในการเปิดตัวโอเพนซอร์ส
บริษัทมักใช้แนวทางแบบปิดเสมอ โดยรักษารายละเอียดต่างๆ เช่น วิธีการฝึกอบรมที่เฉพาะเจาะจงและต้นทุนด้านพลังงานของรุ่นต่างๆ ไว้เป็นความลับ
“เมื่อกล่าวเช่นนั้น ไม่ใช่ทุกคนที่ OpenAI จะเห็นด้วยเช่นกัน” และ “มันไม่ใช่สิ่งที่สำคัญที่สุดสำหรับเราในขณะนี้” ซีอีโอของ OpenAI ยอมรับ
Andrew Ng ผู้ก่อตั้ง Google Brain และอดีตหัวหน้านักวิทยาศาสตร์ของ Baidu กล่าวว่าผลิตภัณฑ์จาก DeepSeek และพันธมิตรแสดงให้เห็นว่าจีนกำลังไล่ตามสหรัฐฯ ในด้าน AI อย่างรวดเร็ว
“เมื่อ ChatGPT เปิดตัวในเดือนพฤศจิกายน 2022 สหรัฐอเมริกาได้ก้าวล้ำหน้าจีนอย่างมากในด้าน AI เชิงสร้างสรรค์… แต่ในความเป็นจริง ช่องว่างดังกล่าวได้ลดลงอย่างรวดเร็วในช่วงสองปีที่ผ่านมา” เขาเขียนบน X “ด้วยโมเดลจากจีนอย่าง Qwen Kimi, InternVL และ DeepSeek กล่าวว่าจีนกำลังปิดช่องว่างดังกล่าวอย่างชัดเจน และในด้านต่างๆ เช่น การสร้างวิดีโอ มีหลายครั้งที่ดูเหมือนว่าจีนจะก้าวล้ำหน้าไป
โมเดล Qwen ได้รับการพัฒนาโดย Alibaba ในขณะที่ Kimi และ InternVL เป็นผลิตภัณฑ์ของบริษัทสตาร์ทอัพ Moonshot AI และ Shanghai AI Lab
หากสหรัฐฯ ยังคงบล็อกโอเพนซอร์ส จีนจะเข้ามาครอบงำส่วนหนึ่งของห่วงโซ่อุปทานนี้ และในที่สุดธุรกิจหลายแห่งก็จะนำเอาโมเดลที่สะท้อนค่านิยมของจีนมากกว่าค่านิยมของสหรัฐฯ มาใช้ ตามที่นาย Ng กล่าว
บริษัทต่างๆ ในสหรัฐฯ หลายแห่งกำลังมองหาวิธีนำโมเดลของ DeepSeek มาใช้กับผลิตภัณฑ์ของตน ตัวอย่างเช่น ผู้ใช้บริการ NIM ของ Nvidia สามารถเข้าถึงโมเดล R1 ได้ตั้งแต่สัปดาห์ที่แล้ว และ Microsoft ยังสนับสนุน R1 บนแพลตฟอร์มคลาวด์ Azure และ GitHub อีกด้วย Amazon อนุญาตให้ลูกค้าสร้างแอปพลิเคชันโดยใช้ R1 ผ่านทาง AWS
อย่างไรก็ตาม ผู้เชี่ยวชาญบางส่วนยังกล่าวอีกว่าความสำเร็จของ DeepSeek ไม่ควรเกินจริง Yann LeCun หัวหน้านักวิทยาศาสตร์ AI ของบริษัท Meta กล่าวว่าแนวคิดที่ว่า "จีนจะแซงหน้าสหรัฐอเมริกาในด้าน AI" เพราะ DeepSeek นั้นไม่ถูกต้อง
“ในทางกลับกัน “โมเดลโอเพนซอร์สกำลังก้าวล้ำหน้าโมเดลแบบเป็นกรรมสิทธิ์” เขาเขียนบน Threads
DeepSeek ซึ่งเป็นบริษัทสตาร์ทอัพที่แยกตัวออกมาจากกองทุนป้องกันความเสี่ยง High-Flyer ของผู้ก่อตั้ง Liang Wenfeng ในเดือนพฤษภาคม 2023 ยังคงเผชิญกับความสงสัยเกี่ยวกับต้นทุนที่แท้จริงและวิธีการฝึกอบรมโมเดล AI
เจิ้งเสี่ยวชิง ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์จากมหาวิทยาลัยฟู่ตั้นชี้ให้เห็นว่าค่าใช้จ่ายในการฝึกอบรม DeepSeek V3 ไม่รวมค่าใช้จ่ายที่เกี่ยวข้องกับการทดสอบและการวิจัย ตามรายงานทางเทคนิคของบริษัทสตาร์ทอัพ
ความสำเร็จของ DeepSeek มาจาก "การเพิ่มประสิทธิภาพทางเทคนิค" เขากล่าว ดังนั้นจึงไม่มีผลกระทบสำคัญต่อการจัดซื้อหรือการจัดส่งชิป
(ตามข้อมูลของ สธท.)
ที่มา: https://vietnamnet.vn/nhung-ten-tuoi-ai-hang-dau-the-gioi-tranh-luan-ve-deepseek-2368357.html
การแสดงความคิดเห็น (0)