(دان تري) - فاجأت شركة بايت دانس، الشركة الأم لتطبيق تيك توك، الجميع عندما قدمت أداة ذكاء اصطناعي قادرة على إنشاء مقاطع فيديو بمحتوى واقعي.
أطلقت شركة بايت دانس، الشركة التكنولوجية التي تقف وراء شبكة التواصل الاجتماعي تيك توك، نموذج ذكاء اصطناعي جديد يسمى OmniHuman-1، مع القدرة على إنشاء مقاطع فيديو متحركة واقعية.
قالت شركة بايت دانس إن OmniHuman-1 يعتمد على تقنية Deepfake، مما يسمح بإنشاء مقاطع فيديو بحركات سلسة للغاية، ومن الصعب جدًا التعرف على أنه منتج من الذكاء الاصطناعي. تزعم شركة ByteDance بثقة أن محرك الذكاء الاصطناعي الخاص بها يمكنه إنشاء منتجات بجودة فائقة مقارنة بأدوات إنشاء الفيديو بالذكاء الاصطناعي الأخرى الموجودة.
فيديو لمحاضرة ألبرت أينشتاين تم إنشاؤها بواسطة OmniHuman-1 من صورة العالم (فيديو: ByteDance).
وفقًا لباحثي ByteDance، يحتاج OmniHuman-1 فقط إلى صورة واحدة وصوت واحد للنمذجة، مثل صوت شخص عشوائي أو صوت الغناء. استنادًا إلى هذه البيانات، يمكن لأداة الذكاء الاصطناعي إنشاء مقاطع فيديو ذات طول عشوائي، بأصوات أو غناء مطابق تمامًا للصوت العينة.
يمكن لـOmniHuman-1 أيضًا تحرير وتعديل مقاطع الفيديو الموجودة لتغيير محتوى الفيديو الأصلي.
بالإضافة إلى ذلك، يسمح OmniHuman-1 أيضًا للمستخدمين بإنشاء مقاطع فيديو جديدة بمجموعة متنوعة من الأنماط المرئية والصوتية، مثل مقاطع الفيديو المتحركة أو الأنماط السينمائية أو مقاطع الفيديو الواقعية.
فيديو تم إنشاؤه بواسطة OmniHuman-1 بناءً على طلب المستخدم (فيديو: ByteDance).
كل ما يحتاجه المستخدمون هو تقديم متطلبات بشأن نسبة العرض إلى الارتفاع، ونسبة الجسم (صورة شخصية، أو نصف جسم، أو جسم كامل، أو الكل في واحد)، ويمكن لأداة الذكاء الاصطناعي هذه إنشاء مقاطع فيديو بأعلى قدر من المصداقية، بما في ذلك الحركات والإضاءة والتفاصيل المحيطة...
لم تقم شركة ByteDance بإصدار OmniHuman-1 رسميًا للجمهور حتى الآن، ولكن الشركة شاركت مقاطع فيديو نموذجية تم إنشاؤها بواسطة الأداة.
تم إنشاء مقطع فيديو مدته 23 ثانية من صورة لألبرت أينشتاين، حيث ألقى العالم الشهير محاضرة، مع حركات وجه وشفتين واقعية.
وتُظهر مقاطع فيديو قصيرة أخرى أنشأها OmniHuman-1 أشخاصًا يعرضون إيماءات وتعبيرات وجهية تشبه الحياة.
فيديو لشخصيات تقدم عروضًا تقديمية، تم إنشاؤه بواسطة OmniHuman-1 من الصور الثابتة (فيديو: ByteDance).
لقد تركت مقاطع الفيديو التوضيحية لقدرات OmniHuman-1 مجتمع الإنترنت وعالم التكنولوجيا في حالة من الرهبة. يعترف الكثير من الناس أن هذا هو الفيديو المزيف الأكثر واقعية الذي شاهدوه على الإطلاق.
قال باحثو بايت دانس إنهم قاموا ببناء نموذج ذكاء اصطناعي قادر على مزج البيانات من الصور ومقاطع الفيديو والصوت لإنشاء مقاطع فيديو واقعية، مع أبعاد الوجه والجسم وتعبيرات الوجه والأفعال... تشبه الإنسان قدر الإمكان.
وقال فريق البحث إن مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي تحتوي على وجوه طبيعية وحركات رأس وإيماءات... تتوافق مع الأصوات والمشاهد المحيطة، مما يساعد على زيادة "الواقعية" في مقاطع الفيديو.
ولم تكشف شركة ByteDance حتى الآن عن موعد توفر OmniHuman-1 للمستخدمين.
فيديو تم إنشاؤه بواسطة OmniHuman-1 من الصور، مع تغير المشهد خارج نافذة القطار بشكل واقعي (فيديو: ByteDance).
ويُظهر ظهور OmniHuman-1 القدرات المذهلة لأدوات الذكاء الاصطناعي القادمة من الصين، لكن الكثيرين يشعرون بالقلق من إمكانية استخدام OmniHuman-1 لأغراض خبيثة، مثل إنشاء مقاطع فيديو مزيفة لمشاهير لمشاركة معلومات كاذبة أو عمليات احتيال أو حتى إنشاء مقاطع فيديو إباحية مزيفة للابتزاز.
أصبح سباق تطوير الذكاء الاصطناعي أكثر كثافة بين الولايات المتحدة والصين، حيث تعمل هاتان القوتان العظميان باستمرار على تقديم أدوات الذكاء الاصطناعي ذات الميزات المتفوقة لهزيمة خصومهما.
قبل بضعة أيام، قامت OpenAI أيضًا بدمج ميزة جديدة في ChatGPT، مما يسمح للأداة بإكمال تقرير من كمية هائلة من البيانات في بضع دقائق فقط، وهي مهمة قد تستغرق ساعات من البشر لإكمالها.
Deepfake هي تقنية ذكاء اصطناعي تستخدم تقنيات تركيب صور شخص ما لدمج صورة الوجه وتركيبها على مقطع فيديو أو صورة شخص آخر.
سيخضع Deepfake لعملية "تعليم"، بناءً على بيانات الإدخال لإنشاء النماذج واختيار الخوارزميات المناسبة لمعالجة تلك النماذج والتعلم منها بشكل مستمر. بعد فترة من "التعلم"، أصبح Deepfake قادرًا على دمج الوجوه بدقة عالية كان من الصعب التعرف عليها بالعين المجردة.
[إعلان رقم 2]
المصدر: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm
تعليق (0)