នៅក្នុងខែមករា ការចាប់ផ្តើមអាជីវកម្មរបស់ចិន DeepSeek បានចាប់ផ្តើមគំរូការសន្និដ្ឋាន R1 ប្រភពបើកចំហរបស់ខ្លួន។ ក្រុមហ៊ុននិយាយថា គំរូភាសាដ៏ធំនៅពីក្រោយ R1 ត្រូវបានបង្កើតឡើងដោយប្រើបន្ទះសៀគ្វីដែលមានថាមពលតិច និងមានតម្លៃទាបជាងម៉ូដែល AI របស់លោកខាងលិច។

វិនិយោគិនបានប្រតិកម្មនឹងព័ត៌មាននេះដោយការបោះចោលភាគហ៊ុនរបស់ Nvidia និងក្រុមហ៊ុនបច្ចេកវិទ្យាផ្សេងទៀត ដែលបណ្តាលឱ្យ Nvidia បាត់បង់ 600 ពាន់លានដុល្លារនៅក្នុងមូលធនប័ត្រទីផ្សារក្នុងរយៈពេលត្រឹមតែមួយថ្ងៃ។ ទោះជាយ៉ាងណាក៏ដោយ ក្រុមហ៊ុន semiconductor ដ៏ធំបំផុតរបស់ពិភពលោកឥឡូវនេះទទួលបានមកវិញនូវអ្វីដែលខ្លួនបានបាត់បង់ភាគច្រើន។

Deepseek bloomberg
ម៉ូដែលភាសាធំរបស់ DeepSeek ត្រូវបានបង្កើតឡើងដោយប្រើប្រាស់បន្ទះឈីបខ្សោយ និងថោកជាងម៉ូដែលលោកខាងលិច។ រូបថត៖ Bloomberg

នៅក្នុងវីដេអូចុងក្រោយរបស់គាត់ លោក Jensen Huang ប្រកែកថា ប្រតិកម្មខ្លាំងរបស់ទីផ្សារគឺមកពីអ្នកវិនិយោគបកស្រាយខុសអំពីវឌ្ឍនភាពរបស់ DeepSeek ។

ពួកគេចោទជាសំណួរថាតើ Big Tech ចំណាយរាប់ពាន់លានដុល្លាលើហេដ្ឋារចនាសម្ព័ន្ធ AI ចាំបាច់ឬអត់ បើត្រូវការថាមពលកុំព្យូទ័រតិចដើម្បីបង្ហាត់ម៉ូដែល។

ទោះបីជាយ៉ាងណាក៏ដោយ លោក Huang បាននិយាយថា ឧស្សាហកម្មនេះនៅតែត្រូវការថាមពលកុំព្យូទ័រសម្រាប់វិធីសាស្រ្តក្រោយការបណ្តុះបណ្តាល ដែលអនុញ្ញាតឱ្យម៉ូដែល AI ធ្វើការសន្និដ្ឋាន ឬការព្យាករណ៍បន្ទាប់ពីបានទទួលការបណ្តុះបណ្តាល។

ដោយសារវិធីសាស្រ្តក្រោយការបណ្តុះបណ្តាលកាន់តែមានភាពចម្រុះ និងជឿនលឿន តម្រូវការសម្រាប់ថាមពលកុំព្យូទ័រដែលបន្ទះឈីប Nvidia ផ្តល់ឲ្យ។

យោងតាមនាយកប្រតិបត្តិ Nvidia វិនិយោគិនគិតថាពិភពលោកមានតែការបណ្តុះបណ្តាលជាមុន និងការសន្និដ្ឋានប៉ុណ្ណោះ (ការសួរសំណួរ AI និងទទួលបានចម្លើយភ្លាមៗ) ប៉ុន្តែការបណ្តុះបណ្តាលក្រោយការបណ្តុះបណ្តាលគឺជាផ្នែកសំខាន់បំផុតនៃ AI ។ នោះហើយជាកន្លែងដែលវារៀនដោះស្រាយបញ្ហាឯកទេស។

ទោះយ៉ាងណាក៏ដោយ លោក Huang មិនបដិសេធថា DeepSeek បាន "ចាក់" ថាមពលបន្ថែមទៀតចូលទៅក្នុងពិភព AI ។ នាយកប្រតិបត្តិ AMD Lisa Su ក៏បានអត្ថាធិប្បាយផងដែរថា DeepSeek កំពុងជំរុញការច្នៃប្រឌិតដែល "ល្អសម្រាប់កម្មវិធី AI" នៅក្នុងបទសម្ភាសន៍មួយកាលពីដើមខែនេះ។

ពាក្យថា ការបណ្តុះបណ្តាលមុន សំដៅលើដំណាក់កាលដំបូងនៃការបណ្តុះបណ្តាលគំរូភាសាធំមួយ (LLM) ដែលគំរូរៀនពីសំណុំទិន្នន័យធំ និងចម្រុះ ជាទូទៅរហូតដល់រាប់លានសញ្ញាសម្ងាត់។

គោលដៅនៅទីនេះគឺដើម្បីជួយឱ្យគំរូទទួលបានការយល់ដឹងទូទៅនៃភាសា បរិបទ និងប្រភេទចំណេះដឹងទូទៅ។ ដំណាក់កាលនេះជារឿយៗត្រូវការថាមពលកុំព្យូទ័រ និងទិន្នន័យដ៏ធំ ដែលចំណាយអស់រាប់រយលានដុល្លារ។

ពាក្យក្រោយការបណ្តុះបណ្តាល ឬការកែតម្រូវគឺនៅពេលដែលអ្នកយកគំរូដែលបានបណ្តុះបណ្តាលពីមុនមក ហើយបណ្តុះបណ្តាលវាម្តងទៀតជាមួយនឹងសំណុំទិន្នន័យជាក់លាក់ជាងនេះ។ សំណុំទិន្នន័យទាំងនេះជាធម្មតាតូចជាង ហើយផ្តោតលើដែន ឬកិច្ចការជាក់លាក់មួយ។

គោលបំណងរបស់វាគឺដើម្បីលៃតម្រូវគំរូឱ្យដំណើរការបានល្អប្រសើរនៅក្នុងសេណារីយ៉ូ និងភារកិច្ចជាក់លាក់ ដែលមិនត្រូវបានគ្របដណ្តប់ឱ្យស៊ីជម្រៅក្នុងអំឡុងពេលបណ្តុះបណ្តាលមុន។ ចំណេះដឹងថ្មីដែលត្រូវបានបន្ថែមនៅក្នុងការបណ្តុះបណ្តាលក្រោយការបណ្តុះបណ្តាលនឹងធ្វើអោយប្រសើរឡើងនូវការអនុវត្តរបស់គំរូច្រើនជាងការពង្រីកចំណេះដឹងទូទៅ។

(យោងទៅតាម Insider, Reddit)