أطلقت شركة جوجل للتو أداة ذكاء اصطناعي جديدة تسمى "Whisk"، والتي تسمح للمستخدمين بتحميل الصور لاسترداد الصور المدمجة التي تم إنشاؤها بواسطة الذكاء الاصطناعي، حتى لو لم يدخل المستخدم أي نص.
يستخدم Whisk الذكاء الاصطناعي لدمج الموضوع والسياق وأسلوب الصورة التي تم تحميلها، مما يؤدي إلى إنشاء صورة جديدة وأكثر تميزًا.
يصف جوجل تطبيق Whisk بأنه "أداة إبداعية" تساعد المستخدمين على توليد أفكار بصرية جديدة بسرعة دون الحاجة إلى مهارات تحرير الصور الاحترافية. وفقًا لجوجل، فإن الأداة ليست محرر صور تقليديًا، بل هي أداة ذكاء اصطناعي ممتعة تهدف إلى إثارة الإبداع والاكتشاف السريع.
عندما يقوم المستخدم بتحميل صورة، يستخدم Whisk مزيجًا من خدمة الذكاء الاصطناعي من Google، وGemini، وتكنولوجيا Imagen 3 - وهي أداة تنشئ صورًا من نص حصلت عليه Google من DeepMind.
سيقوم برنامج Gemini بتحليل الصورة وإنشاء تعليق توضيحي لها، ثم سيقوم برنامج Imagen 3 بدمج عناصر تلك الصورة بطريقة إبداعية، مع الاحتفاظ بجوهر الموضوع بدلاً من نسخه تمامًا.
واجهة أداة الخفق. لقطة الشاشة
وهذا يعني أن النتيجة النهائية قد لا تكون مطابقة بنسبة 100% للصورة الأصلية. على سبيل المثال، قد يختلف الطول أو تسريحة الشعر أو لون بشرة الأشخاص في الصورة الجديدة عن الصورة الأصلية. ومع ذلك، لا يزال بإمكان المستخدمين ضبط معلومات الإدخال، أو تغيير السياق، أو النمط، أو الجمع بين موضوعات متعددة لإنشاء صور مختلفة.
يمكن لـ Whisk إنشاء صور ليس فقط من النصوص ولكن أيضًا من الصور الأصلية، مما يوسع الاحتمالات الإبداعية دون الحاجة إلى أن يكون لدى المستخدمين خبرة في تحرير الصور. قال توماس إيليجك، مدير إدارة المنتجات في Google Labs: "تم تصميم Whisk لمساعدة المستخدمين على إعادة مزج الموضوعات والسياقات والأنماط بطرق إبداعية، مما يسمح لهم بالاستكشاف بصريًا بدلاً من تحرير كل بكسل بدقة".
على الرغم من أن Whisk لا يزال في مراحله الأولى من التطوير، فقد تم إطلاق الأداة كموقع ويب على Google Labs وهي متاحة حاليًا للمستخدمين في الولايات المتحدة.
وقال دان إيفز، المدير الإداري وكبير المحللين في شركة ويدبوش للأوراق المالية، إن ويسك تمثل "لحظة أخرى لإظهار القوة" بالنسبة لجوجل في سباق التكنولوجيا.
وأشار إيفز أيضًا إلى أن DeepMind، مختبر الذكاء الاصطناعي الذي استحوذت عليه Google في عام 2014، يعد أحد الأصول الرئيسية التي تساعد Google في الحفاظ على مكانتها في مجال الذكاء الاصطناعي. تشكل منتجات الذكاء الاصطناعي، بما في ذلك Whisk، جزءًا أساسيًا من استراتيجية تطوير منتجات Google في السنوات القادمة، حيث من المتوقع إطلاق العديد من المنتجات الجديدة بحلول عام 2025.
تفتح أداة Whisk آفاقًا جديدة لاستخدام الذكاء الاصطناعي لإنشاء منتجات مبتكرة دون تدخل كبير من المستخدم. ويظهر هذا تقدم الذكاء الاصطناعي في فهم العناصر المرئية والجمع بينها بشكل إبداعي.
تعد Whisk جزءًا من اتجاه متزايد بين شركات التكنولوجيا الكبرى، بما في ذلك Google وOpenAI، لتطوير أدوات الذكاء الاصطناعي للمستهلكين. تهدف هذه الأدوات إلى تقديم تجارب إبداعية جديدة، بدءًا من إنشاء الصور والنصوص وحتى مقاطع الفيديو. مؤخرًا، قدمت شركة OpenAI أيضًا مولدًا للنصوص إلى مقاطع فيديو يُدعى Sora، والذي يتنافس بشكل مباشر مع Whisk.
نغوك آنه (وفقًا لشبكة CNN، وThe Verge، وZDNET)
[إعلان رقم 2]
المصدر: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
تعليق (0)