ChatGPT "dibuja como una foto"
El 26 de marzo, la comunidad de usuarios de IA (inteligencia artificial) de todo el mundo y de Vietnam se emocionó cuando OpenAI lanzó oficialmente Images in ChatGPT centrándose en las capacidades de creación de imágenes para los usuarios de los modelos inteligentes de la compañía. Anteriormente, ChatGPT también tenía la capacidad de generar imágenes, pero era limitada y tenía que pasar por otro famoso modelo de texto a imagen llamado DALL-E.
La capacidad de esta herramienta para convertir texto en dibujos y "combinar imágenes como Photoshop" atrajo rápidamente la atención. Muchos dijeron que la calidad de la imagen de salida era "increíble" y la mayoría la calificó como "superior" a los modelos de IA populares actualmente en el mercado.
ChatGPT crea tazas de café realistas con solo un simple comando
Según Gabriel Goh, director de investigación de OpenAI, la mejora significativa en la capacidad de generación de imágenes de ChatGPT utilizando el modelo GPT-4o es "Binding", un término que describe el grado en el que el generador de imágenes de IA mantiene la conexión entre los atributos y los objetos. El Sr. Goh afirmó que GPT-4o puede asociar con precisión atributos para 15-20 objetos diferentes sin confusión, mejorando significativamente la precisión y confiabilidad del contenido generado.
Images in ChatGPT no solo se destaca por su capacidad de creación de imágenes, sino que también resuelve la debilidad "fatal" de otras herramientas de IA para la creación de imágenes, que es mostrar escritura y texto dentro de la imagen. De hecho, muchas imágenes contienen texto representado con gran precisión, lo que hace aún más difícil determinar si la imagen es real o falsa.
La desventaja de esta herramienta es que tarda mucho tiempo en crear imágenes, pero se considera razonable porque el retraso se crea porque las imágenes de buena calidad, los detalles precisos y la coincidencia con la descripción del usuario siempre requieren paciencia. El equipo dijo que el problema de latencia se mejorará en el futuro.
Muchas preocupaciones sobre la capacidad de combinar fotos
Además de la diversión en la experiencia inicial que ChatGPT y OpenAI brindan a los usuarios, el tema de la seguridad de la información, la privacidad y el riesgo de explotación vuelven a ser temas de interés. "En un futuro cercano, las imágenes que ves en línea pueden no ser necesariamente reales", expresó con preocupación un usuario de Facebook en Vietnam cuando pudo pedirle a ChatGPT que creara imágenes completamente irreales que parecieran tan reales como fotos, por ejemplo, una foto del actor y ex luchador Dwayne Johnson (The Rock) anunciando una marca de chicles, o una foto de un gato calicó sentado en la estufa que parece exactamente una foto.
Con comandos detallados proporcionados, los usuarios pueden crear resultados sorprendentes sin necesidad de conocimientos profundos sobre el uso de herramientas de edición de fotografías tradicionales.
Muchas personas incluso han probado la capacidad de "pelado" de la nueva herramienta. TN (Hanoi) dijo que usó una foto de modelo tomada de Internet para pedirle a ChatGPT que cambiara la ropa según lo solicitado y casi todos los comandos se cumplieron con gran precisión. “Sin embargo, todavía hubo algunos rechazos, principalmente debido a violaciones a las políticas del sistema sobre la creación de imágenes con derechos de autor o tener contenido demasiado sugerente”, compartió TN.
En las pruebas de Thanh Nien , ChatGPT se negó a crear imágenes relacionadas con personajes famosos o con derechos de autor en el mundo real o en películas e historias. "No puedo crear la imagen solicitada porque la imagen de referencia que enviaste muestra claramente al personaje Doctor Strange, un personaje con derechos de autor de Marvel y esto viola la política de contenido actual", respondió el sistema cuando se le pidió crear una imagen de Doctor Strange sentado... bebiendo té helado en Vietnam.
Jackie Shannon, jefa de productos multimodales en ChatGPT, afirma que las imágenes en ChatGPT tienen una fuerte protección contra contenido deepfake, pornográfico o fraudulento. En particular, las imágenes generadas incorporarán metadatos compatibles con C2PA para marcarlas como generadas por IA, pero requerirán herramientas independientes para verificarlas.
Sin embargo, todavía hay muchas personas que logran eludir la ley y utilizan imágenes de personajes famosos con fines de entretenimiento. Por ejemplo, el CEO Tim Cook sosteniendo un teléfono Samsung en lugar de un iPhone, o el actor Robert Downey Jr. masticando dulces vegetales o una imagen de Cristiano Ronaldo peleando por el balón con Lionel Messi en un pequeño callejón en Vietnam frente a mucha gente...
[anuncio_2]
Fuente: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Kommentar (0)