Vietnam.vn - Nền tảng quảng bá Việt Nam

Les outils de conversion de la parole en texte de l'IA « déforment » également

Công LuậnCông Luận29/10/2024

(CLO) L'outil de conversion de la parole en texte Whisper d'OpenAI est présenté comme étant « robuste et précis au niveau humain », mais il présente un inconvénient majeur : il a tendance à fabriquer des extraits de texte ou même des phrases entières !


Certains des textes qu'il produit, connus dans l'industrie sous le nom d'hallucinogènes, peuvent inclure des commentaires racistes, de la violence et même des traitements médicaux imaginaires, disent les experts.

Les experts affirment que de telles fabrications sont graves car Whisper est utilisé dans un large éventail d’industries à travers le monde pour traduire et transcrire des interviews, générer du texte et sous-titrer des vidéos.

Plus inquiétant encore, les centres médicaux utilisent des outils basés sur Whisper pour enregistrer les consultations patients-médecins, malgré l'avertissement d'OpenAI selon lequel l'outil ne doit pas être utilisé dans les « zones à haut risque ».

Outil de conversion de la parole en texte que tout le monde peut manipuler image 1

Les phrases commençant par « #Vérité fondamentale » sont ce qui a été réellement dit, les phrases commençant par « #texte » sont ce que Whisper a transcrit. Photo : AP

Les chercheurs et les ingénieurs affirment que Whisper produit fréquemment des hallucinations pendant son utilisation. Par exemple, un chercheur de l’Université du Michigan a déclaré avoir trouvé des hallucinations dans huit enregistrements sur dix qu’il a examinés.

Un ingénieur en apprentissage automatique a initialement découvert la distorsion dans environ la moitié des plus de 100 heures de transcriptions de Whisper qu'il a analysées. Un troisième développeur a déclaré avoir détecté des hallucinations dans presque chacune des 26 000 notes créées à l’aide de Whisper.

L’illusion persiste même dans de courts échantillons audio bien enregistrés. Une étude récente menée par des informaticiens a découvert 187 distorsions dans plus de 13 000 clips audio clairs qu’ils ont examinés.

Cette tendance entraînerait des dizaines de milliers d’erreurs sur des millions d’enregistrements, ont déclaré les chercheurs.

De telles erreurs peuvent avoir des « conséquences très graves », en particulier dans un contexte hospitalier, a déclaré Alondra Nelson, professeur à l’École des sciences sociales de l’Institute for Advanced Study.

« Personne ne souhaite recevoir un mauvais diagnostic. Il faut une barrière plus stricte », a déclaré Nelson.

Les professeurs Allison Koenecke de l'Université Cornell et Mona Sloane de l'Université de Virginie ont examiné des milliers de courts extraits qu'ils ont récupérés de TalkBank, une archive de recherche hébergée à l'Université Carnegie Mellon. Ils ont déterminé que près de 40 % des hallucinations étaient nocives ou dérangeantes, car l’orateur pouvait être mal compris ou mal représenté.

Dans un enregistrement, un orateur a décrit « deux autres filles et une femme », mais Whisper a fabriqué un commentaire racial supplémentaire, ajoutant « deux autres filles et une femme, euh, noire ».

Dans une autre transcription, Whisper a inventé un médicament inexistant appelé « antibiotiques à activité accrue ».

Alors que la plupart des développeurs supposent que les outils de transcription peuvent faire des fautes d'orthographe ou d'autres erreurs, les ingénieurs et les chercheurs affirment qu'ils n'ont jamais vu un outil de transcription alimenté par l'IA aussi hallucinogène que Whisper.

L'outil est intégré à plusieurs versions du chatbot phare d'OpenAI, ChatGPT, et constitue un service intégré aux plateformes de cloud computing d'Oracle et de Microsoft, au service de milliers d'entreprises dans le monde. Il est également utilisé pour transcrire et traduire du texte dans de nombreuses langues.

Ngoc Anh (selon AP)



Source : https://www.congluan.vn/cong-cu-chuyen-giong-noi-thanh-van-ban-ai-cung-co-the-xuyen-tac-post319008.html

Comment (0)

No data
No data

Même sujet

Même catégorie

Les habitants de Hô-Chi-Minh-Ville regardent avec impatience les hélicoptères hisser le drapeau national
Cet été, Da Nang vous attend avec des plages ensoleillées.
Des hélicoptères formés pour faire voler et hisser le drapeau du Parti et le drapeau national dans le ciel de Ho Chi Minh-Ville
La tendance des « bébés patriotiques » se répand sur les réseaux sociaux à l'approche des vacances du 30 avril

Même auteur

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit