Le fait que Google ait intégré Bard dans de nombreuses applications comme Gmail, YouTube, Google Maps et Flights constitue un gros avantage par rapport à ChatGPT. OpenAI a récemment annoncé que la version gratuite de ChatGPT permettra bientôt la saisie vocale et d’images.
Cela signifie que les utilisateurs peuvent poser des questions à ChatGPT de manière plus naturelle que sur iPhone et Android, ou même utiliser des images pour obtenir de meilleures réponses. L’essentiel est que les utilisateurs n’auront pas à payer pour ChatGPT Plus pour recevoir les mises à jour, même si les comptes payants seront le premier groupe à bénéficier d’un essai.
Les utilisateurs de comptes Plus et Enterprise recevront cette mise à jour dans les deux prochaines semaines, suivis par d'autres groupes d'utilisateurs, y compris les développeurs. L'utilisation d'images pour la saisie dans ChatGPT est la manière dont fonctionnent les modèles d'IA multimodaux. C'est similaire à la façon dont le géant de la recherche utilise Google Lens avec l'IA.
Deux nouvelles fonctionnalités sur ChatGPT devraient attirer plus d'utilisateurs que Google Bard
En attendant, la fonctionnalité d'assistance vocale ne sera disponible que sur l'application ChatGPT pour iPhone et Android. Les utilisateurs doivent simplement l’activer dans les paramètres de l’application une fois cette fonctionnalité ouverte. OpenAI affirme que ChatGPT n'a besoin que de quelques secondes d'échantillon de parole pour générer un son de type humain à partir d'un texte, et il utilise un nouveau modèle de synthèse vocale pour y parvenir.
Cette technologie est capable de générer des voix synthétiques réalistes à partir de paroles réelles en quelques secondes, ouvrant la porte à de nombreuses applications innovantes et axées sur l’accessibilité. Mais cela comporte également de nouveaux risques, comme la possibilité de se faire passer pour des personnes célèbres ou de commettre des fraudes. OpenAI a également déclaré qu'il s'associait à Spotify pour tester une fonctionnalité de traduction vocale pour les podcasts, permettant aux créateurs de traduire leur contenu dans d'autres langues en utilisant leur propre voix.
Lien source
Comment (0)