នៅចុងខែមករា DeepSeek បានយកពិភពបច្ចេកវិទ្យាពិភពលោកដោយព្យុះជាមួយនឹងការចេញផ្សាយម៉ូដែល LLM ពីរដែលដូចគ្នាទៅនឹងផលិតផលអាមេរិកប៉ុន្តែមានតម្លៃប្រភាគនៃតម្លៃ។ ក្នុងចំណោមពួកគេ គំរូហេតុផលប្រភពបើកចំហ DeepSeek-R1 អាចដោះស្រាយបញ្ហាវិទ្យាសាស្ត្រមួយចំនួនដូចគ្នាទៅនឹង o1 ដែលជា LLM កម្រិតខ្ពស់បំផុតរបស់ OpenAI ។

ខណៈពេលដែលពិភពលោកមានការភ្ញាក់ផ្អើល អ្នកស្រាវជ្រាវក្នុងស្រុកបាននិយាយថា សមិទ្ធិផលនេះគឺអាចទស្សន៍ទាយបានទាំងស្រុង និងស្របតាមមហិច្ឆតារបស់ទីក្រុងប៉េកាំងក្នុងការក្លាយជាមហាអំណាចឈានមុខគេក្នុងវិស័យបញ្ញាសិប្បនិមិត្ត (AI)។

Yunji Chen អ្នកវិទ្យាសាស្ត្រកុំព្យូទ័រនៅវិទ្យាស្ថានវិទ្យាសាស្ត្រកុំព្យូទ័រនៃបណ្ឌិត្យសភាវិទ្យាសាស្ត្រចិនបានចង្អុលបង្ហាញថាមិនយូរមិនឆាប់ក្រុមហ៊ុនដូចជា DeepSeek នឹងបង្ហាញខ្លួននៅក្នុងប្រទេសចិន។

នេះគឺដោយសារតែចំនួនទឹកប្រាក់ដ៏ច្រើននៃដើមទុនវិនិយោគដែលបានចាក់ចូលទៅក្នុងក្រុមហ៊ុនអភិវឌ្ឍន៍ LLM និងចំនួនអ្នកដែលមាន PhDs ក្នុងមុខវិជ្ជា STEM (វិទ្យាសាស្ត្រ បច្ចេកវិទ្យា វិស្វកម្ម ឬគណិតវិទ្យា)។

Chen បាននិយាយថា "ប្រសិនបើមិនមាន DeepSeek ទេនោះនឹងមាន LLMs របស់ចិនផ្សេងទៀត" ។

នេះ​គឺ​ជា​ការ​ពិត​ដែល​បាន​បញ្ជាក់។ ប៉ុន្មានថ្ងៃបន្ទាប់ពី DeepSeek "ការរញ្ជួយដី" Alibaba បានចេញផ្សាយ LLM កម្រិតខ្ពស់បំផុតរបស់ខ្លួនរហូតមកដល់បច្ចុប្បន្ន Qwen2.5-Max ដែលវាអះអាងថាដំណើរការជាង DeepSeek-V3 ។

Moonshot AI និង ByteDance ក៏បានប្រកាសនូវគំរូការសន្និដ្ឋានថ្មី Kimi 1.5 និង 1.5-pro ដែលអាចដំណើរការបានជាង o1 នៅក្នុងការធ្វើតេស្តគោលមួយចំនួន។

អាទិភាពរបស់រដ្ឋាភិបាល

ក្នុងឆ្នាំ 2017 រដ្ឋាភិបាលចិនបានប្រកាសពីចេតនារបស់ខ្លួនក្នុងការក្លាយជាអ្នកដឹកនាំពិភពលោកក្នុងវិស័យ AI នៅឆ្នាំ 2030។ ប្រទេសចិនមានគោលបំណងដើម្បីបញ្ចប់នូវរបកគំហើញសំខាន់ៗនៅក្នុង AI "ដើម្បីឱ្យបច្ចេកវិទ្យា និងកម្មវិធីឈានដល់កម្រិតឈានមុខគេលើពិភពលោក" នៅឆ្នាំ 2025។

ដើម្បីធ្វើដូច្នេះបាន ការអភិវឌ្ឍន៍ប្រព័ន្ធទេពកោសល្យ AI គឺជាអាទិភាពកំពូល។ នៅឆ្នាំ 2022 ក្រសួងអប់រំរបស់ប្រទេសចិននឹងអនុញ្ញាតឱ្យសាកលវិទ្យាល័យចំនួន 440 ផ្តល់ជូនជំនាញ AI នេះបើយោងតាមរបាយការណ៍ពីមជ្ឈមណ្ឌលសន្តិសុខ និងបច្ចេកវិទ្យាដែលកំពុងរីកចម្រើនរបស់សាកលវិទ្យាល័យ Georgetown University (CSET)។

នៅឆ្នាំដដែលនោះ ប្រទេសចិនមានពាក់កណ្តាលនៃក្រុមអ្នកស្រាវជ្រាវ AI កំពូលៗ ខណៈដែលសហរដ្ឋអាមេរិកបានចូលរួមចំណែកត្រឹមតែ 18% ប៉ុណ្ណោះ បើយោងតាមទីប្រឹក្សា MacroPolo ។

Deepseek bloomberg
DeepSeek ធ្វើ​ឱ្យ​ភ្ញាក់​ផ្អើល​ជា​មួយ​នឹង​ស៊េរី​នៃ​ស៊េរី​ភាសា​ដែល​មាន​តម្លៃ​ទាប និង​មាន​ប្រសិទ្ធភាព​ខ្ពស់។ រូបថត៖ Bloomberg

Marina Zhang អ្នកស្រាវជ្រាវវិទ្យាសាស្ត្រគោលនយោបាយនៅសាកលវិទ្យាល័យបច្ចេកវិទ្យាស៊ីដនីបាននិយាយថា DeepSeek ទំនងជាទទួលបានអត្ថប្រយោជន៍ពីការវិនិយោគរបស់រដ្ឋាភិបាលក្នុងការបណ្តុះបណ្តាល AI និងការអភិវឌ្ឍន៍ទេពកោសល្យ រួមទាំងអាហារូបករណ៍ជាច្រើន ជំនួយស្រាវជ្រាវ និងភាពជាដៃគូរវាងវិស័យសិក្សា និងឧស្សាហកម្ម។

ជាឧទាហរណ៍ គំនិតផ្តួចផ្តើមដែលគាំទ្រដោយរដ្ឋដូចជាមន្ទីរពិសោធន៍វិស្វកម្មជាតិសម្រាប់បច្ចេកវិទ្យាសិក្សាជ្រៅ និងកម្មវិធីបានបណ្តុះបណ្តាលអ្នកជំនាញ AI រាប់ពាន់នាក់។

វាពិបាកក្នុងការស្វែងរកតួលេខពិតប្រាកដលើកម្លាំងការងាររបស់ DeepSeek ប៉ុន្តែស្ថាបនិក Liang Wenfeng ចែករំលែកថាក្រុមហ៊ុនជ្រើសរើសនិស្សិតបញ្ចប់ការសិក្សា និងបណ្ឌិតពីសាកលវិទ្យាល័យធំៗរបស់ប្រទេស។

លោក Zhang បាននិយាយថាសមាជិកមួយចំនួននៃក្រុមអ្នកដឹកនាំមានអាយុក្រោម 35 ឆ្នាំ ហើយបានរីកចម្រើនជាមួយនឹងការកើនឡើងរបស់ប្រទេសចិនក្នុងនាមជាមហាអំណាចបច្ចេកវិទ្យា។ "ពួកគេត្រូវបានលើកទឹកចិត្តយ៉ាងខ្លាំងដោយការពឹងផ្អែកលើខ្លួនឯងនៅក្នុងការច្នៃប្រឌិត" ។

Wenfeng អាយុ 39 ឆ្នាំបានបញ្ចប់ការសិក្សាថ្នាក់វិទ្យាសាស្ត្រកុំព្យូទ័រពីសាកលវិទ្យាល័យ Zhejiang ។ គាត់បានបង្កើតមូលនិធិការពារហានិភ័យ High-Flyer ជិតមួយទសវត្សរ៍មុន ហើយបានបង្កើត DeepSeek ក្នុងឆ្នាំ 2023។

គោលនយោបាយជាតិដែលជំរុញប្រព័ន្ធអេកូគំរូសម្រាប់ AI នឹងជួយក្រុមហ៊ុនដូចជា DeepSeek ទាក់ទាញទាំងការផ្តល់មូលនិធិ និងមនុស្ស នេះបើយោងតាមលោក Jacob Feldgoise ដែលសិក្សាជំនាញ AI នៅប្រទេសចិននៅ CSET ។

ប៉ុន្តែទោះបីជាមានការកើនឡើងនៃវគ្គសិក្សា AI នៅសាកលវិទ្យាល័យក៏ដោយ Feldgoise មិនច្បាស់ថាតើមានសិស្សប៉ុន្មាននាក់ដែលបានបញ្ចប់ការសិក្សាដោយសញ្ញាបត្រ AI និងថាតើពួកគេកំពុងត្រូវបានបង្រៀនជំនាញដែលក្រុមហ៊ុនត្រូវការដែរឬទេ។

ក្នុងប៉ុន្មានឆ្នាំថ្មីៗនេះ ក្រុមហ៊ុន AI របស់ចិនបានត្អូញត្អែរថានិស្សិតបញ្ចប់ការសិក្សាពីកម្មវិធីទាំងនេះមិនបំពេញតាមការរំពឹងទុករបស់ពួកគេ ដែលជំរុញឱ្យអ្នកខ្លះចាប់ដៃគូជាមួយសាកលវិទ្យាល័យនានាដើម្បីបង្កើនគុណភាព។

"អត់ធ្មត់"

អ្នកវិទ្យាសាស្ត្រនិយាយថា ប្រហែលជាធាតុផ្សំដ៏គួរឱ្យចាប់អារម្មណ៍បំផុតនៃភាពជោគជ័យរបស់ DeepSeek គឺថាពួកគេបានបង្កើត DeepSeek-R1 និង Janus-Pro-7B នៅក្នុងបរិបទនៃការគ្រប់គ្រងការនាំចេញរបស់រដ្ឋាភិបាលសហរដ្ឋអាមេរិក ដែលបានរារាំងការចូលប្រើបន្ទះឈីប AI កម្រិតខ្ពស់ចាប់តាំងពីឆ្នាំ 2022។

យោងតាមលោក Zhang ក្រុមហ៊ុន DeepSeek តំណាងឱ្យវិធីសាស្រ្តរបស់ចិនជាក់លាក់មួយចំពោះការច្នៃប្រឌិត ដោយសង្កត់ធ្ងន់ទៅលើប្រសិទ្ធភាពក្នុងការប្រឈមមុខនឹងឧបសគ្គជាច្រើន។

ការចាប់ផ្តើមរបស់ក្រុមហ៊ុន Wenfeng និយាយថាខ្លួនបានប្រើប្រាស់បន្ទះឈីប Nvidia H800 ប្រហែល 2,000 ដើម្បីបណ្តុះបណ្តាល DeepSeek-V3 ។ ផ្ទុយទៅវិញ Llama 3.1 405B ដែលជា LLM ដ៏ទំនើបដែលចេញដោយ Meta ក្នុងខែកក្កដា ឆ្នាំ 2024 គឺផ្អែកលើបន្ទះឈីប Nvidia H100 ជាង 16,000 ។

ទេពកោសល្យ 9x ទទួលបានការចាប់អារម្មណ៍ជាពិសេសពីនាយករដ្ឋមន្ត្រីចិន Li Qiang ទេពកោសល្យ 9x ទទួលបានការចាប់អារម្មណ៍ជាពិសេសពីនាយករដ្ឋមន្ត្រីចិន Li Qiang

នៅក្នុងការបង្ហោះ WeChat ឆ្នាំ 2022, High-Flyer បាននិយាយថាវាមាន 10,000 នៃបន្ទះឈីប A100 ចាស់របស់ Nvidia ។ លោក Wenfeng បានប្រាប់ប្រព័ន្ធផ្សព្វផ្សាយចិនក្នុងខែកក្កដា ឆ្នាំ 2024 ថា "បញ្ហាដែលយើងប្រឈមមុខមិនដែលមានលុយទេ ប៉ុន្តែការហាមឃាត់លើបន្ទះឈីបកម្រិតខ្ពស់" ។

DeepSeek ប្រើវិធីជាច្រើនដើម្បីបង្កើនប្រសិទ្ធភាពនៃម៉ូដែលរបស់វា។ ជាឧទាហរណ៍ វាអនុវត្តស្ថាបត្យកម្ម Mixture of Experts (MoE) ដែលជាវិធីសាស្រ្តរៀនម៉ាស៊ីនដែលបណ្តុះបណ្តាលម៉ូដែលលឿនជាងមុនជាមួយនឹងប៉ារ៉ាម៉ែត្រតិចជាងបច្ចេកទេសបុរាណ។

វាជួយម៉ូដែលរថភ្លើង DeepSeek ជាមួយនឹងបន្ទះឈីបតិចជាងនេះបើយោងតាមអ្នកវិទ្យាសាស្ត្រកុំព្យូទ័ររបស់សាកលវិទ្យាល័យស៊ីដនី Chang Xu ។

បច្ចេកទេសមួយទៀតគឺ Multi-head latent attention (MLA) ដែលអនុញ្ញាតឱ្យម៉ូដែលរក្សាទុកទិន្នន័យកាន់តែច្រើនជាមួយនឹងអង្គចងចាំតិច។

សមិទ្ធិផលរបស់ DeepSeek អាចជា "ផ្លូវណែនាំ" សម្រាប់ប្រទេសដែលមានមហិច្ឆតា AI ប៉ុន្តែខ្វះធនធានហិរញ្ញវត្ថុ និងផ្នែករឹងដើម្បីបណ្តុះបណ្តាល LLMs ដ៏ធំនេះ Yanbo Wang អ្នកស្រាវជ្រាវវិទ្យាសាស្ត្រគោលនយោបាយនៅសាកលវិទ្យាល័យហុងកុងបាននិយាយថា។

(តាមធម្មជាតិ សំណាង)

ប្រភព៖ https://vietnamnet.vn/cach-trung-quoc-tao-ra-deepseek-va-rung-chuyen-the-gioi-2391114.html