وبحسب فريق تطوير بايت دانس، فإن النموذج المتعدد الوسائط، المسمى OmniHuman-1، يمكنه إنشاء مقاطع فيديو غامرة لشخصيات تتحدث وتغني وتتحرك بجودة "متفوقة على طرق إنشاء الفيديو الحالية".

تُعرف تقنية الذكاء الاصطناعي التي تنشئ صورًا ومقاطع فيديو وأصواتًا تشبه الأشخاص الحقيقيين أيضًا باسم "deepfake" - وهي تقنية تُستخدم بشكل متزايد في الاحتيال بالإضافة إلى الترفيه.

تعتبر ByteDance واحدة من شركات الذكاء الاصطناعي الأكثر شهرة في الصين. يعد تطبيق Doubao الخاص بالشركة هو الأكثر شعبية بين المستخدمين في البر الرئيسي.

على الرغم من أن OmniHuman-1 لم يتم إصداره للجمهور بعد، فقد انتشرت مقاطع الفيديو النموذجية له بسرعة كبيرة.

ومن بين العروض التوضيحية البارزة مقطع فيديو مدته 23 ثانية يصور ألبرت أينشتاين وهو يلقي خطابًا. يصف موقع TechCrunch منتجات التطبيق بأنها "رائعة بشكل صادم" و"أكثر مقاطع الفيديو المزيفة واقعية حتى الآن".

وقال المطور إن OmniHuman-1 يحتاج فقط إلى صورة واحدة كبيانات مرجعية إلى جانب بيانات صوتية مثل الكلام أو الغناء لإنشاء مقطع فيديو بأي طول.

من الممكن تعديل معدل إطارات الفيديو الناتج، بالإضافة إلى "نسب الجسم" للشخصية الموجودة فيه.

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
تعتبر ByteDance واحدة من أبرز شركات الذكاء الاصطناعي في الصين. الصورة: TechCrunch

ليس هذا فحسب، بل إن نموذج الذكاء الاصطناعي، الذي تم تدريبه على 19 ألف ساعة من محتوى الفيديو من مصادر غير عامة، قادر أيضًا على تحرير مقاطع الفيديو الموجودة، وحتى تغيير إيماءات اليد والقدم البشرية بمستوى مقنع.

ومع ذلك، اعترفت شركة ByteDance أيضًا بأن OmniHuman-1 ليس مثاليًا، حيث لا يزال يواجه صعوبة في وضعيات معينة، وأن "صور مرجعية منخفضة الجودة" لن تنتج أفضل مقاطع الفيديو.

يُظهر نموذج الذكاء الاصطناعي الجديد لشركة ByteDance تقدم الصين على الرغم من جهود واشنطن للحد من صادرات التكنولوجيا.

مخاوف

في العام الماضي، انتشرت مقاطع فيديو مزيفة سياسية على نطاق واسع. في مولدوفا، أظهرت مقاطع فيديو مزيفة رئيسة البلاد مايا ساندو وهي تلقي خطاب استقالتها.

وفي جنوب أفريقيا، انتشر مقطع فيديو مزيف لمغني الراب إيمينيم وهو يدعم حزبًا معارضًا في جنوب أفريقيا، وذلك قبل الانتخابات في البلاد.

كما يتم استخدام تقنية Deepfakes بشكل متزايد لارتكاب الجرائم المالية. يتم خداع المستهلكين من خلال عمليات تزييف عميقة للمشاهير الذين يوصون بالاستثمارات، ويقدمون فرص استثمارية وهمية، بينما خسرت الشركات أيضًا ملايين الدولارات بسبب منتحلين شخصيات كبار المسؤولين التنفيذيين.

وبحسب شركة ديلويت، ساهم المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي في خسائر احتيال تزيد عن 12 مليار دولار في عام 2023، ويمكن أن تصل إلى 40 مليار دولار في الولايات المتحدة بحلول عام 2027.

في فبراير/شباط الماضي، وقع مئات الأشخاص في مجتمع الذكاء الاصطناعي على رسالة تطالب بفرض ضوابط صارمة على المحتوى المزيف العميق. في غياب تجريم تزوير المعلومات على المستوى الفيدرالي في الولايات المتحدة، أقرت أكثر من 10 ولايات قوانين ضد تزوير المعلومات باستخدام الذكاء الاصطناعي.

ومع ذلك، فإن اكتشاف التزييف العميق ليس بالأمر السهل. وعلى الرغم من أن بعض شبكات التواصل الاجتماعي ومحركات البحث قد اتخذت إجراءات للحد من انتشارها، إلا أن كمية المحتوى المزيف عبر الإنترنت لا تزال تنمو بمعدل ينذر بالخطر.

في استطلاع أجرته شركة التحقق من الهوية Jumio في مايو 2024، قال 60% من المشاركين إنهم واجهوا تزييفًا عميقًا في العام الماضي؛ وقال 72% من المشاركين إنهم يشعرون بالقلق بشأن تعرضهم للخداع من خلال مقاطع الفيديو المزيفة بشكل يومي، بينما أيدت الأغلبية تمرير قوانين لمعالجة انتشار مقاطع الفيديو المزيفة التي يتم إنشاؤها بواسطة الذكاء الاصطناعي.

جوجل تعطي الضوء الأخضر لاستخدام الذكاء الاصطناعي في تطوير الأسلحة وتكنولوجيا المراقبة . تخلت شركة جوجل عن "وعدها" بعدم تصميم ونشر أدوات الذكاء الاصطناعي لاستخدامها في تقنيات الأسلحة والمراقبة.