سيتم الإعلان عن مشروع البحث لزيادة دقة نماذج التعرف على الكلام في الوقت الفعلي (التعرف التلقائي على الكلام عبر البث) بواسطة Le Duy Khanh - مهندس "GenZ" في Zalo AI - لأول مرة في المؤتمر العلمي الدولي الذي سيعقد في اليونان في سبتمبر 2024.
تحت عنوان " تحسين التعرف على الكلام المتدفق باستخدام الانتباه السياقي المحول زمنيًا وإخفاء السياق الأيمن الديناميكي " ، حقق بحث مهندس الذكاء الاصطناعي في Zalo المولود في عام 2000 درجة شبه مثالية - 11/12 نقطة، مجتازًا جولة المراجعة الصارمة مع أكثر من 2000 ورقة بحثية مشاركة لتقديمها في مؤتمر Interspeech في شكل جلسة شفوية.
" أنا فخور جدًا بأن مقالتي العلمية الأولى تم الاعتراف بها من قبل مؤتمر علمي مرموق، وأتيحت لي الفرصة لتقديم إنجازات البحث في فيتنام إلى شركات التكنولوجيا الكبرى والخبراء والمجتمع الدولي "، شارك لي دوي خانه.
تحت إشراف الدكتور تشاو ثانه دوك - رئيس قسم البحث والتطوير في Zalo AI، المحاضر في جامعة العلوم (جامعة مدينة هوشي منه الوطنية)، من المتوقع أن يقدم مشروع البحث هذا مساهمة مهمة في ترقية نماذج التعرف على الكلام، وزيادة دقة إملاء الصوت وتحويل الصوت إلى نص على تطبيق Zalo.
قال الدكتور تشاو ثانه دوك : " إنّ دمج أبحاث زالو للذكاء الاصطناعي العملية للغاية في أوراق علمية وتقديمها في مؤتمرات دولية مرموقة أمر بالغ الأهمية. فهو لا يُظهر فقط قدرات المهندسين الفيتناميين، بل يُظهر أيضًا الرغبة في تبادل الخبرات والمساهمة في تطوير مجتمع الذكاء الاصطناعي العالمي" .
وفي السابق، قامت Zalo بدمج هذا البحث في تطبيق المراسلة الخاص بها اعتبارًا من نهاية عام 2023، مما أدى إلى تحسين دقة ميزة "إنشاء الرسائل الصوتية" بشكل كبير. تتيح هذه الميزة للمستخدمين إنشاء الرسائل بالصوت بدلاً من الكتابة، مما يوفر الوقت ويجعلها أكثر ملاءمة في العديد من مواقف الاستخدام. وفي الوقت نفسه، وصلت دقة هذه الميزة إلى 95% في الممارسة العملية؛ انخفض معدل الحاجة إلى إعادة تحرير النص بعد كتابته بالصوت من 6.4% إلى 4.8% فقط.
وبحسب إحصائيات Zalo، ورغم أن الميزة لا تزال في مرحلة الاختبار، إلا أنها أنتجت ما يقرب من 4.5 مليون رسالة يوميًا وجذبت حوالي 3.2 مليون مستخدم شهريًا (تم تحديث البيانات حتى يونيو 2024).
منذ أن بدأت رحلتها الرائدة في مجال أبحاث الذكاء الاصطناعي في عام 2017، آمنت Zalo دائمًا بـ "تمكين" الجيل الشاب. في الوقت الحالي، ينتمي ما يصل إلى 31% من موظفي Zalo إلى جيل GenZ. في عام 2021، تم أيضًا الاعتراف بموضوعين بحثيين آخرين لفريق هندسة الذكاء الاصطناعي في Zalo فيما يتعلق بتكنولوجيا معالجة الكلام في المؤتمر الدولي لمنطقة آسيا والمحيط الهادئ حول الذكاء الاصطناعي (PRICAI 2021). والجدير بالذكر أن مؤلفي هذين الموضوعين هم جميعًا باحثون شباب لم تتجاوز أعمارهم الثلاثين عامًا.
Interspeech هو مؤتمر دولي طويل الأمد وشامل ومرموق في مجال معالجة الكلام، تنظمه جمعية الاتصالات الكلامية الدولية. سيعقد المؤتمر هذا العام تحت عنوان " الخطاب وما بعده " في الفترة من 1 إلى 5 سبتمبر 2024 في جزيرة كوس (اليونان).
تعليق (0)