(CLO) Google vient de lancer un nouvel outil d'intelligence artificielle (IA) appelé « Whiskk », permettant aux utilisateurs de télécharger des photos pour récupérer des images combinées générées par l'IA, même si l'utilisateur ne saisit aucun texte.
Whisk utilise l'IA pour combiner le sujet, le contexte et le style d'une photo téléchargée, créant ainsi une image nouvelle et plus unique.
Whisk est décrit par Google comme un « outil créatif » qui aide les utilisateurs à générer rapidement de nouvelles idées visuelles sans nécessiter de compétences professionnelles en retouche photo. Selon Google, l’outil n’est pas un éditeur d’images traditionnel, mais plutôt un outil d’IA amusant qui vise à stimuler la créativité et la découverte rapide.
Lorsqu'un utilisateur télécharge une photo, Whisk utilise une combinaison du service d'IA de Google, Gemini, et de la technologie Imagen 3, un outil qui crée des images à partir de texte que Google a acquis auprès de DeepMind.
Gemini analysera la photo et créera une légende, puis Imagen 3 combinera les éléments de cette photo de manière créative, en conservant « l’essence » du sujet plutôt que de le copier exactement.
Interface de l'outil fouet. Capture d'écran
Cela signifie que le résultat final peut ne pas être identique à 100 % à l’image originale. Par exemple, la taille, la coiffure ou le teint des sujets de la nouvelle image peuvent différer de l’original. Cependant, les utilisateurs peuvent toujours ajuster les informations d'entrée, modifier le contexte, le style ou combiner plusieurs thèmes pour créer différentes images.
Whisk peut créer des images non seulement à partir de texte mais également à partir d'images originales, élargissant ainsi les possibilités créatives sans nécessiter que les utilisateurs aient une expérience en retouche photo. « Whisk est conçu pour aider les utilisateurs à remixer les sujets, les contextes et les styles de manière créative, leur permettant d'explorer visuellement plutôt que de modifier méticuleusement chaque pixel », a déclaré Thomas Iljic, directeur de la gestion des produits chez Google Labs.
Bien que Whisk soit à ses débuts de développement, l'outil a été lancé en tant que site Web sur Google Labs et est désormais disponible pour les utilisateurs aux États-Unis.
Dan Ives, directeur général et analyste principal chez Wedbush Securities, a déclaré que Whisk marque un autre « moment de démonstration de force » pour Google dans la course technologique.
Ives a également noté que DeepMind, le laboratoire d'IA acquis par Google en 2014, est un atout clé qui aide Google à maintenir sa position dans le domaine de l'IA. Les produits d'IA, dont Whisk, constituent un élément clé de la stratégie de développement de produits de Google dans les années à venir, plusieurs nouveaux produits devant être lancés d'ici 2025.
L’outil Whisk ouvre de nouvelles voies pour utiliser l’IA afin de créer des produits innovants sans grande intervention de l’utilisateur. Cela montre les progrès de l’IA dans la compréhension et la combinaison créative d’éléments visuels.
Whisk s'inscrit dans une tendance croissante parmi les grandes entreprises technologiques, notamment Google et OpenAI, visant à développer des outils d'IA pour les consommateurs. Ces outils sont destinés à offrir de nouvelles expériences créatives, de la création d'images, de textes aux vidéos. Récemment, OpenAI a également introduit un générateur de texte en vidéo appelé Sora, qui concurrence directement Whisk.
Ngoc Anh (selon CNN, The Verge, ZDNET)
Source : https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
Comment (0)