في أواخر شهر يناير، أحدثت شركة DeepSeek ضجة كبيرة في عالم التكنولوجيا العالمي بإطلاقها نموذجين من برنامج LLM يتساوىان مع المنتجات الأمريكية لكن تكلفتهما أقل بكثير من السعر. ومن بينها، يمكن لنموذج التفكير مفتوح المصدر DeepSeek-R1 حل بعض المشاكل العلمية نفسها التي يواجهها o1، وهو برنامج الماجستير في القانون الأكثر تقدمًا من OpenAI.

وفي حين فوجئ العالم بهذا الإنجاز، قال باحثون محليون إن هذا الإنجاز كان متوقعا تماما ويتماشى مع طموح بكين لتصبح قوة رائدة في مجال الذكاء الاصطناعي.

ويشير يونجي تشين، عالم الكمبيوتر في معهد علوم الكمبيوتر التابع للأكاديمية الصينية للعلوم، إلى أنه عاجلاً أم آجلاً ستظهر شركة مثل DeepSeek في الصين.

ويرجع ذلك إلى حجم رأس المال الاستثماري الضخم الذي يتدفق على شركات تطوير برامج الماجستير في القانون وعدد الأشخاص الحاصلين على درجة الدكتوراه في مجالات العلوم والتكنولوجيا والهندسة والرياضيات.

وقال تشين "إذا لم يكن هناك DeepSeek، فسيكون هناك طلاب ماجستير آخرون في القانون الصيني" .

وهذه حقيقة مثبتة. بعد أيام من "زلزال" DeepSeek، أصدرت شركة علي بابا برنامجها الأكثر تقدمًا LLM حتى الآن، Qwen2.5-Max، والذي تدعي الشركة أنه يتفوق على DeepSeek-V3.

وأعلنت Moonshot AI وByteDance أيضًا عن نماذج استدلال جديدة، Kimi 1.5 و1.5-pro، والتي يمكنها التفوق على o1 في بعض اختبارات المعايير.

أولويات الحكومة

في عام 2017، أعلنت الحكومة الصينية عن نيتها أن تصبح رائدة عالمية في مجال الذكاء الاصطناعي بحلول عام 2030. وتهدف الصين إلى تحقيق اختراقات كبرى في مجال الذكاء الاصطناعي "بحيث تصل التكنولوجيا والتطبيقات إلى مستويات رائدة عالميًا" بحلول عام 2025.

ولتحقيق هذه الغاية، يعد تطوير نظام الذكاء الاصطناعي للمواهب أولوية قصوى. وبحلول عام 2022، ستسمح وزارة التعليم الصينية لـ 440 جامعة بتقديم تخصصات الذكاء الاصطناعي، وفقًا لتقرير صادر عن مركز الأمن والتكنولوجيا الناشئة بجامعة جورج تاون.

وفي العام نفسه، استحوذت الصين على نصف الباحثين الأوائل في مجال الذكاء الاصطناعي، في حين ساهمت الولايات المتحدة بنحو 18% فقط، وفقاً لشركة الاستشارات ماكرو بولو.

ديب سيك بلومبرج
تفاجئ شركة DeepSeek بسلسلة من نماذج اللغة الكبيرة منخفضة التكلفة وعالية الأداء. الصورة: بلومبرج

وقالت مارينا تشانغ، الباحثة في علوم السياسات بجامعة سيدني للتكنولوجيا، إن شركة DeepSeek ربما استفادت من الاستثمار الحكومي في تدريب الذكاء الاصطناعي وتنمية المواهب، بما في ذلك العديد من المنح الدراسية ومنح الأبحاث والشراكات بين الأوساط الأكاديمية والصناعة.

على سبيل المثال، قامت المبادرات المدعومة من الدولة مثل المختبر الوطني للهندسة لتقنيات وتطبيقات التعلم العميق بتدريب الآلاف من خبراء الذكاء الاصطناعي.

من الصعب العثور على أرقام دقيقة حول القوى العاملة في DeepSeek، لكن مؤسس الشركة ليانج وينفينج يقول إن الشركة توظف الخريجين وطلاب الدكتوراه من أكبر الجامعات في البلاد.

وقال تشانج إن بعض أعضاء فريق القيادة تقل أعمارهم عن 35 عامًا ونشأوا مع صعود الصين كقوة عظمى في مجال التكنولوجيا. "إنهم مدفوعون بشدة بالاعتماد على الذات في الابتكار."

حصل وينفنغ، 39 عامًا، على درجة في علوم الكمبيوتر من جامعة تشجيانغ. شارك في تأسيس صندوق التحوط High-Flyer منذ ما يقرب من عقد من الزمان وأسس DeepSeek في عام 2023.

ويقول جاكوب فيلدجويس، الذي يدرس مواهب الذكاء الاصطناعي في الصين في مركز CSET، إن السياسات الوطنية التي تعزز نظامًا بيئيًا نموذجيًا للذكاء الاصطناعي ستساعد الشركات مثل DeepSeek على جذب التمويل والأشخاص.

ولكن على الرغم من ارتفاع عدد دورات الذكاء الاصطناعي في الجامعات، فإن فيلدجويس ليس واضحًا بشأن عدد الطلاب الذين يتخرجون بدرجات علمية في الذكاء الاصطناعي وما إذا كانوا يتلقون المهارات التي تحتاجها الشركات.

وفي السنوات الأخيرة، اشتكت شركات الذكاء الاصطناعي الصينية من أن خريجي هذه البرامج لا يلبون توقعاتها، مما دفع البعض إلى الشراكة مع الجامعات لتحسين الجودة.

"التلطيف"

ويقول العلماء إن العنصر الأكثر إثارة للإعجاب في نجاح DeepSeek ربما هو أنهم طوروا DeepSeek-R1 و Janus-Pro-7B في سياق ضوابط التصدير الحكومية الأمريكية التي منعت الوصول إلى شرائح الحوسبة المتقدمة للذكاء الاصطناعي منذ عام 2022.

وبحسب تشانج، يمثل DeepSeek نهجًا صينيًا متميزًا للابتكار، مع التركيز على الكفاءة في مواجهة مجموعة كبيرة من القيود.

وتقول شركة Wenfeng الناشئة إنها استخدمت حوالي 2000 شريحة Nvidia H800 لتدريب DeepSeek-V3. في المقابل، يعتمد Llama 3.1 405B، وهو LLM متطور أصدرته Meta في يوليو 2024، على أكثر من 16000 شريحة Nvidia H100.

موهبة 9x تحظى باهتمام خاص من رئيس الوزراء الصيني لي تشيانغ موهبة 9x تحظى باهتمام خاص من رئيس الوزراء الصيني لي تشيانغ

في منشور على WeChat عام 2022، قالت شركة High-Flyer إنها تمتلك 10000 من شرائح A100 القديمة من شركة Nvidia. وقال وينفينج لوسائل الإعلام الصينية في يوليو/تموز 2024: "المشكلة التي نواجهها لم تكن المال أبدًا، بل الحظر المفروض على الرقائق عالية الجودة".

تستخدم DeepSeek مجموعة متنوعة من الطرق لزيادة كفاءة نماذجها. على سبيل المثال، تقوم بتنفيذ بنية مزيج الخبراء (MoE)، وهو نهج التعلم الآلي الذي يقوم بتدريب النماذج بشكل أسرع مع معلمات أقل من التقنيات التقليدية.

ويساعد ذلك DeepSeek في تدريب النماذج باستخدام عدد أقل من الرقائق، وفقًا لعالم الكمبيوتر تشانج شو من جامعة سيدني.

هناك تقنية أخرى وهي الانتباه الكامن متعدد الرؤوس (MLA)، والتي تسمح للنموذج بتخزين المزيد من البيانات باستخدام ذاكرة أقل.

وقال يانبو وانج، الباحث في علوم السياسات بجامعة هونج كونج، إن إنجازات DeepSeek يمكن أن تكون "دليلاً" للدول التي لديها طموحات في مجال الذكاء الاصطناعي ولكنها تفتقر إلى الموارد المالية والأجهزة اللازمة لتدريب طلاب الماجستير في القانون.

(حسب الطبيعة والحظ)

المصدر: https://vietnamnet.vn/bi-mat-dang-sau-deepseek-trung-quoc-khien-ca-the-gioi-chao-dao-voi-cu-soc-ai-2391114.html