الميزة الأكثر أهمية في VASA-1 هي أنها تسمح للمستخدمين بتحريك أي صورة. بإمكانهم التقاط صورة لشخص ما وجعله يتحرك بشكل معبر ويتحدث ويغني. ما يثير الاهتمام في هذا الحل للذكاء الاصطناعي هو المستوى العالي من الواقعية الذي يوفره.
يمكن لـVASA-1 جعل الصور أكثر وضوحًا
يركز حل VASA-1 على تحسين إمكانية الوصول للأشخاص الذين يعانون من صعوبات في التواصل. ويهدف إلى توفير الرفقة أو الدعم العلاجي لأولئك الذين يحتاجون إليها، مما يسمح بإنشاء وجوه واقعية تتحدث في الوقت الحقيقي. كل ما يتطلبه VASA-1 هو صورة وجه الشخص الذي يريدون إضافة صوت إليه. بالإضافة إلى ذلك، فهو يسمح للمستخدمين بإضافة عناصر أخرى لجعل الأمور أكثر واقعية. يمكن للمستخدمين أيضًا تعديل وضع العينين أو حركة الفم، مما يجعل الوجه يبتسم أو يصرخ.
وتؤكد مايكروسوفت على مدى واقعية وواقعية مقاطع الفيديو هذه التي يتم إنشاؤها من صورة الشخص، ولكن الأمر لا يقتصر فقط على القدرة على إضافة الصوت والحركات السهلة والواقعية إلى الرسومات أو الفن، حيث يتمتع VASA-1 بالقدرة على إضافة المشاعر وتعبيرات الوجه والقدرة على إضافة الحركة إلى الرأس.
لن يتم إطلاق VASA-1 للعامة.
ومع ذلك، وكما هو الحال مع Sora من OpenAI، تحذر Microsoft من أن VASA-1 لن يكون متاحًا لأنها لن تنشر أي عروض توضيحية أو واجهات برمجة تطبيقات أو منتجات أو خدمات مرتبطة بـ VASA-1. من الممكن أن تكون هذه مجرد النسخة الأولى من هذه التقنية الجديدة وما زالت في مرحلة التطوير، وتشعر مايكروسوفت بالقلق بشأن خطر استخدام التزييف العميق لأغراض خبيثة. لذلك، يبدو أنه يتم استخدامه فقط في الاتفاقيات مع المراكز المتخصصة التي تعمل مع الأشخاص الذين يعانون من مشاكل مختلفة في التواصل.
ربما سيتم نشر VASA-1 في المستقبل، ولكن بطريقة خاضعة للرقابة لتجنب المشاكل. تستهدف VASA-A المؤسسات العامة القادرة على إنشاء مساعدين افتراضيين أكثر سهولة في الاستخدام، ويمكنها أيضًا أن تكون ميزة إضافية لبرنامج Copilot، مما يؤدي إلى إنشاء مساعد افتراضي قريب مباشرة في نظام التشغيل Windows.
ومع ذلك، حتى لو حدث ذلك، فإن مايكروسوفت تشعر بقلق بالغ بشأن مشكلات الأمان لتجنب استغلالها لاستخدام المنصة في عمليات الاحتيال أو تشجيع الاستثمار في الأنشطة الاحتيالية.
[إعلان 2]
رابط المصدر
تعليق (0)