أطلقت شركة جوجل للتو أداة جديدة للذكاء الاصطناعي تسمى "Whisk"، والتي تسمح للمستخدمين بتحميل الصور لاسترداد الصور المجمعة التي تم إنشاؤها بواسطة الذكاء الاصطناعي، حتى لو لم يدخل المستخدم أي نص.
يستخدم Whisk الذكاء الاصطناعي لدمج الموضوع والسياق وأسلوب الصورة التي تم تحميلها، مما يؤدي إلى إنشاء صورة جديدة وفريدة من نوعها.
يصف جوجل تطبيق Whisk بأنه "أداة إبداعية" تساعد المستخدمين على توليد أفكار بصرية جديدة بسرعة دون الحاجة إلى مهارات تحرير الصور الاحترافية. وفقًا لجوجل، فإن الأداة ليست محرر صور تقليدي، بل هي أداة ذكاء اصطناعي ممتعة تهدف إلى إثارة الإبداع والاكتشاف السريع.
عندما يقوم المستخدم بتحميل صورة، يستخدم Whisk مزيجًا من خدمة الذكاء الاصطناعي من Google، وGemini، وتكنولوجيا Imagen 3 - وهي أداة تنشئ صورًا من نص حصلت عليه Google من DeepMind.
سيقوم برنامج Gemini بتحليل الصورة وإنشاء تعليق عليها، ثم سيقوم برنامج Imagen 3 بدمج عناصر تلك الصورة بطريقة إبداعية، مع الاحتفاظ بجوهر الموضوع بدلاً من نسخه بدقة.
واجهة أداة الخفق. لقطة شاشة
وهذا يعني أن النتيجة النهائية قد لا تكون مطابقة بنسبة 100% للصورة الأصلية. على سبيل المثال، قد يختلف طول الأشخاص أو تسريحة شعرهم أو لون بشرتهم في الصورة الجديدة عن الصورة الأصلية. ومع ذلك، لا يزال بإمكان المستخدمين ضبط معلومات الإدخال، أو تغيير السياق، أو الأسلوب، أو الجمع بين موضوعات متعددة لإنشاء صور مختلفة.
يمكن لبرنامج Whisk إنشاء صور ليس فقط من النصوص ولكن أيضًا من الصور الأصلية، مما يوسع الاحتمالات الإبداعية دون الحاجة إلى أن يكون لدى المستخدمين خبرة في تحرير الصور. قال توماس إيليجك، مدير إدارة المنتجات في Google Labs: "تم تصميم Whisk لمساعدة المستخدمين على إعادة مزج الموضوعات والسياقات والأنماط بطرق إبداعية، مما يسمح لهم بالاستكشاف بصريًا بدلاً من تحرير كل بكسل بدقة".
على الرغم من أن Whisk لا يزال في مراحله الأولى من التطوير، فقد تم إطلاق الأداة كموقع ويب على Google Labs وهي الآن متاحة للمستخدمين في الولايات المتحدة.
وقال دان إيفز، المدير الإداري وكبير المحللين في شركة ويدبوش للأوراق المالية، إن ويسك يمثل "لحظة أخرى من إظهار القوة" بالنسبة لجوجل في سباق التكنولوجيا.
وأشار إيفز أيضًا إلى أن DeepMind، مختبر الذكاء الاصطناعي الذي استحوذت عليه Google في عام 2014، يعد أحد الأصول الرئيسية التي تساعد Google في الحفاظ على مكانتها في مجال الذكاء الاصطناعي. تشكل منتجات الذكاء الاصطناعي، بما في ذلك Whisk، جزءًا أساسيًا من استراتيجية تطوير منتجات Google في السنوات القادمة، حيث من المتوقع إطلاق العديد من المنتجات الجديدة بحلول عام 2025.
تفتح أداة Whisk آفاقًا جديدة لاستخدام الذكاء الاصطناعي لإنشاء منتجات مبتكرة دون تدخل كبير من المستخدم. ويظهر هذا تقدم الذكاء الاصطناعي في فهم العناصر المرئية والجمع بينها بشكل إبداعي.
تعد Whisk جزءًا من اتجاه متزايد بين شركات التكنولوجيا الكبرى، بما في ذلك Google وOpenAI، لتطوير أدوات الذكاء الاصطناعي للمستهلكين. تهدف هذه الأدوات إلى تقديم تجارب إبداعية جديدة، بدءًا من إنشاء الصور والنصوص وحتى مقاطع الفيديو. مؤخرًا، قدمت OpenAI أيضًا مولدًا لتحويل النصوص إلى فيديو يسمى Sora، والذي يتنافس بشكل مباشر مع Whisk.
نغوك آنه (وفقًا لشبكة CNN، وThe Verge، وZDNET)
[إعلان 2]
المصدر: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
تعليق (0)