أثار المنتج سريعًا ضجة في مجتمع العلوم والتكنولوجيا الفيتنامي.

اختر الطريق الصعب لحل المشاكل الفيتنامية

في نهاية عام 2022، من المتوقع أن يحدث ChatGPT "ضجة كبيرة"، ويفتح سباقًا للسيطرة على الذكاء الاصطناعي بين البلدان والشركات العملاقة في مجال التكنولوجيا. في ذلك الوقت، كان مجتمع التكنولوجيا الفيتنامي أيضًا حريصًا على تطوير المنتجات الفيتنامية لتصبح مستقلة من الناحية التكنولوجية وتقليل الاعتماد على المنتجات الدولية. ومع ذلك، ليس كل وحدة لديها القدرة والعزيمة لتحقيق هذه الرغبة مثل VinBigdata.

الذكاء الاصطناعي التوليدي مشكلة صعبة. شركات كبيرة مثل OpenAI أو Google تحتاج أيضًا إلى إنفاق الكثير من الموارد والوقت على الأبحاث لتتمكن من ابتكار منتجات كما نراها. هذه المنتجات جيدة جدًا، لكن في الواقع، لا يزال العلماء لا يفهمون آلية عملها تمامًا. قليلون هم من يستطيعون التنبؤ بالأخطاء التي قد تظهر فيها. تطوير منتج مشابه لـ ChatGPT للفيتناميين، في فترة قصيرة لا تتجاوز عامًا، يواجه تحديات كثيرة. لكننا اخترنا "المخاطرة" لأنه إذا لم يُصنع فيتناميون نسخة فيتنامية من ChatGPT، فمن سيصنعها؟ - البروفيسور فو ها فان - المدير العلمي لـ VinBigdata شارك.

في الواقع، هناك عدد قليل جدًا من الشركات التي تختار بناء نموذج اللغة الكبير الخاص بها من الصفر. مثل OpenAI، يحتوي GPT 3 على 175 مليار معلمة وتم تدريبه على مجموعة بيانات بحجم 45 تيرابايت وتكلف 4.6 مليون دولار. وبحسب الحسابات، فإن حجم الأموال اللازمة لتطوير GPT 4 قد يصل إلى 100 مليون دولار أميركي. قال الدكتور نجوين كيم آنه، مدير المنتجات في شركة VinBigdata: "مع وجود مثل هذه الأعداد الضخمة، من الصعب العثور على شركة يمكنها تحمل تكاليف الاستثمار في هذه التكنولوجيا".

الصورة 1.jpg

من أجل تمكين الشركات الفيتنامية من الوصول إلى تقنية الذكاء الاصطناعي من الجيل الجديد، بتكاليف وبنية أساسية مثالية، اختارت VinBigdata اتجاهًا مختلفًا تمامًا، وهو إنشاء نموذج لغوي يحتوي على 1.6 مليار معلمة فقط، ولكن بقدرات تعادل نماذج اللغة الكبيرة التي تحتوي على مليارات المعلمات. وأضاف الدكتور نجوين كيم آنه: "تُظهر النتائج أنه باستخدام الهندسة المعمارية التي طورتها شركة VinBigdata نفسها، من الممكن تمامًا تحسين وتسريع عملية تدريب نموذج اللغة، وخفض تكاليف البنية التحتية (بما في ذلك تكاليف التدريب وتكاليف الاستخدام)، مع ضمان جودة النموذج".

بعد حل مشكلة حجم نموذج اللغة الكبير، أثناء عملية "تصور" ViGPT، وبعد دراسة النماذج الأجنبية، أدرك فريق VinBigdata أيضًا تحديًا آخر: "الوهم"، القادم من الطبيعة المتأصلة في نماذج الاحتمالات الإحصائية.

وبناءً على ذلك، غالبًا ما يتم تدريب نماذج اللغة الأكبر في العالم باستخدام مصادر البيانات الإنجليزية. ولذلك فإن هذا النموذج لا يفهم حقًا السياق وثقافة الشعب الفيتنامي ولا يستجيب بشكل صحيح لهما. ويؤدي هذا إلى هلوسة تجعل نموذج اللغة الكبير "يختلق" إجابات غير صحيحة.

الصورة 3.jpg

من أجل العثور على الحل الأمثل في أقصر وقت، تم تقسيم فريق معالجة اللغة الطبيعية (NLP) في VinBigdata إلى مجموعات صغيرة، لتحليل ومناقشة الأفكار المختلفة للعثور على الاتجاه النهائي الأكثر ملاءمة.

وأضاف الدكتور نجوين كيم آنه: "في النهاية، قررنا تطوير بنية مختلفة عن معظم نماذج اللغة الكبيرة الحالية، وإجراء تدريب على مجموعة بيانات فيتنامية دقيقة بحجم 600 جيجابايت، لإنشاء "مساعد افتراضي ذكي" قادر على فهم وإعطاء إجابات وفقًا لسياق الشعب الفيتنامي".

التطلع إلى نظام بيئي للتكنولوجيا الفيتنامية

وفقًا لنتائج التقييم من معايير تقييم إتقان اللغة الفيتنامية (VMLU)، حقق ViGPT متوسط ​​درجة 42.24%، في المرتبة الثانية بعد ChatGPT (48.54%). تتيح هذه النتيجة لـ ViGPT البحث بسرعة عن المعلومات والإجابة على الأسئلة حول موضوعات محددة خاصة بفيتنام.

بالإضافة إلى قدرات المساعد الافتراضي، فإن ما يريده فريق التطوير هو دمج ViGPT في المنتجات المألوفة المستخدمة يوميًا، من أجل إحداث تغييرات في حياة الشعب الفيتنامي. هذا هو الدافع الذي يدفع فريق VinBigdata إلى بناء نظام بيئي من منتجات اللغة والصوت باستخدام ViGPT - النظام البيئي "Vi" بما في ذلك: ViChat، ViVoice، ViVi Virtual Assistant. يمكن استخدام هذه المنتجات في العديد من الصناعات، من صناعة السيارات، والخدمات المصرفية والمالية، والتأمين إلى النقل والعديد من المجالات الأخرى.

عند العمل مع التكنولوجيا، وخاصةً الذكاء الاصطناعي، لا نهدف فقط إلى إتقان أنظمة معقدة ومثيرة للاهتمام يصعب فهمها، بل نهدف أيضًا إلى ابتكار منتجات ملموسة وقابلة للتطبيق، حيث يكون الذكاء الاصطناعي العامل المباشر في إحداث التغييرات في الحياة، كما أكد مدير المنتجات في VinBigdata.

الصورة 4.jpg

ومن ثم فإن التطوير الناجح لـ ViGPT ما هو إلا الخطوة الأولى في رحلة جلب التكنولوجيا والبيانات "الفيتنامية الخالصة" لخدمة حياة الملايين من الشعب الفيتنامي. وقال ممثل شركة VinBigdata أن هذه الوحدة تهدف إلى دمج ViGPT في منصة الذكاء الاصطناعي المتعدد الإدراك VinBase 2.0، لتوفير حلول متميزة للأنظمة التنظيمية والشركات من مختلف الأحجام والصناعات.

قبل ViGPT، ترك فريق الخبراء والمهندسين في مجال تكنولوجيا معالجة اللغة والكلام VinBigdata بصمته من خلال إطلاق ViVi - أول مساعد افتراضي فيتنامي شامل (يتم تطبيقه ونشره على سيارات VinFast الكهربائية وتطبيقات Vinhomes Resident ومنصة التجارة الإلكترونية Vinhomes Online)، في نفس الوقت، إتقان التقنيات الأكثر تقدمًا في العالم مثل Voice Biometrics أو Voice Cloning.

تم تطوير كل هذه التقنيات بالاعتماد على قاعدة بيانات بحجم 3500 تيرابايت، مع التركيز بشكل أساسي على البيانات الخاصة بفيتنام، والتي تم جمعها وتحليلها وصقلها بواسطة VinBigdata. الهدف النهائي هو جلب التكنولوجيا العالمية إلى الحياة الفيتنامية، باستخدام البيانات وأنظمة المعرفة الفيتنامية.

ViGPT هو "الإصدار الفيتنامي الأول من ChatGPT" للمستخدمين النهائيين المبني على نموذج اللغة الفيتنامية الكبيرة (LLM) الذي طورته VinBigdata. يتمتع برنامج ViGPT بميزات رائعة وهو مصمم لتلبية احتياجات المستخدمين الفيتناميين بشكل أفضل مثل إنشاء المحتوى والبحث عن المعلومات والإجابة على الأسئلة الشائعة النموذجية في فيتنام. سجل واستمتع بتجربة ViGPT على: vigpt.vinbigdata.com

ثانه ها