Vietnam.vn - Nền tảng quảng bá Việt Nam

인공지능이 베트남어 세계에 진출하다

VietNamNetVietNamNet15/06/2023

[광고_1]
인공지능은 인간이 언어를 배우는 데 도움을 줄 뿐만 아니라, 시스템이 더 나은 언어 지능을 지원하는 데도 도움을 줍니다.

AI를 결합해 베트남어를 '가르친다'

베트남의 외국인 직접 투자(FDI) 기업 대표는 베트남어를 빠르게 배우고 일반 문서 내용의 90%를 읽고 싶어합니다. 문제는 그가 너무 바빠서 공부할 시간이 1시간(매일 12시~13시) 정도밖에 없다는 것입니다. 그렇다면 외국어를 빠르게 배울 수 있도록 언어 학습 소프트웨어에 기술을 어떻게 적용해야 할까요?

위의 내용은 호치민시 국립대학교 산하 베트남 과학대학교 계산언어학 센터 소장인 딘 디엔(Dinh Dien) 박사가 제기한 FDI 기업의 리더십 문제에 대한 내용입니다.

기계 번역, 비판적 언어학, 외국인을 위한 베트남어 교육 분야에서 인공지능(AI)을 적용하는 것에 대한 많은 과학 연구 주제와 국제 간행물을 발표한 사람으로서, 디엔 부교수는 언어학의 문제를 해결하는 데 AI를 적용하는 것이 필수적이라고 생각합니다.

구체적으로 말하면, 언어를 배우는 첫 번째 단계는 언어의 소리를 가르치는 것입니다. 여기서 장벽은 베트남어에는 성조와 리듬이 있기 때문에 영어, 프랑스어 등 성조가 없는 언어를 학습하는 사람에게 베트남어를 가르치는 것은 매우 어려울 것이라는 점입니다. 예를 들어, "이제 잠자리에 들 거야?"라고 묻는 대신, 그러면 학습자는 음조를 구별할 수 없기 때문에 "아직 멍청하니?"라고 말할 것입니다. 발음할 때 사냥감을 어디에 놓아야 하는지, 어떤 입 모양을 잡아야 하는지, 올바른 발음과 틀린 발음의 차이가 무엇인지 가르쳐야 합니다.

이때 외국어 교육에 AI 응용 소프트웨어가 활용되어, 이를 닦는 입 모양을 시뮬레이션하고, 학습자가 따라할 수 있는 소리를 냅니다. 그런 다음 학습자는 소리를 재생하고 소프트웨어에 녹음한 다음 기술을 사용하여 학습자의 발음을 소프트웨어의 표준 발음과 비교하여 발음을 빠르게 향상시킵니다. 위의 모든 단계에는 AI 적용이 필요합니다.

또 다른 예로, 고(故) 황페 교수가 편집한 언어학 연구소 베트남어 사전에 따르면, 원래 베트남어 어휘는 약 34,000개입니다. 계산에 따르면 약 10%의 단어를 기계에 가르쳐야 하는데, 이는 3,400단어의 응용 정보에 해당하며, 기계가 일반적인 베트남어 텍스트의 약 90%를 읽을 수 있도록 해야 합니다. 이 데이터 표를 얻기 위해 디엔 부교수는 AI를 사용하여 베트남어 코퍼스의 어휘 체계에 라벨을 지정해야 했습니다.

AI는 교육 분야의 가르치고 배우는 방식을 바꾸었다고 할 수 있습니다. 사실, 많은 인공지능 애플리케이션은 가르치고 배우는 과정을 더 빠르고 효과적으로 만들기 위해 탄생했습니다.

위에서 언급한 컴퓨터 과학과 언어학을 결합한 흥미로운 이야기는 AI를 실제로 훈련시키고 적용하는 과정이 매우 필요하지만 쉽지 않다는 것을 보여줍니다. 데이터는 여러 계층의 식별자로 구분되어야 하며, 각 계층은 서로 다른 특정 식별자를 사용하여 각 변수를 처리해야 합니다.

기계가 언어를 학습하면...

인공지능은 인간이 언어를 배우는 데 도움을 줄 뿐만 아니라, 시스템이 더 나은 언어 지능을 지원하는 데도 도움을 줍니다. 기계는 매일 훈련되고 개선됩니다.

디엔 부교수의 이야기와 비슷하게, 지능형 조수가 인간의 언어를 이해하는 방법에 대한 또 다른 생생한 예가 있습니다.

이는 다양한 지역 방언의 목소리를 잘 인식할 수 있도록 자동차에 탑재되는 베트남어 음성 비서 키키를 연구하고 개발하는 과정입니다. 컴퓨터 과학에서 음성 인식은 인공 지능(AI)의 중요한 분야로, 인간의 음성을 컴퓨터 애플리케이션이 이해하고 사용할 수 있는 형식으로 변환합니다. 이 기술은 기계와 인간 사이의 상호작용을 위한 다리 역할을 합니다. 음성 비서는 전 세계적으로 없어서는 안 될 애플리케이션이 되었습니다. 가장 인기 있는 것으로는 Apple의 Siri, Google Assistant, Amazon Alexa, 베트남의 Kiki 등이 있습니다.

키키의 첫 번째 코드 줄을 작성한 응우옌 황 칸 두이 씨는 음성을 인식하고 사용자에게 올바르게 응답할 수 있을 만큼 똑똑한 AI 모델을 훈련시키는 데 언어 데이터가 핵심적인 역할을 한다고 말했습니다.

예를 들어, 자동차에서 베트남어 도우미 키키를 사용하는 사용자에게 매우 중요한 기능 중 하나는 내비게이션입니다. 따라서 제품 개발팀은 사용자 명령을 "원활하게" 지원하기 위해 데이터와 어휘를 준비해야 합니다. 데이터 수집과 모델 학습을 거친 후, 이후 버전의 음성 ​​인식 품질 지수는 원래 버전에 비해 40% 향상되었습니다.

자동차의 음성 인식은 단순히 내비게이션이나 위치 문제에만 국한되지 않고, 다른 많은 문제를 수반합니다.

예를 들어, 자동차에서 키키를 사용할 경우 도로의 엔진 소음, 바람 소리, 교통 장비 소음도 매우 커서 자동차에서 키키의 음성 인식 품질에 직접적인 영향을 미칩니다. 따라서 키키 팀은 소음이 많은 환경에서 말하는 데이터를 실제 생활과 최대한 비슷하게 향상시켜 소음이 많은 상황을 해결해야 했습니다.

또한, 자기 지도 학습과 같은 새로운 기술이 세상에 등장하면서 키키는 레이블이 지정되지 않은 데이터에서도 "학습"을 시도하여 모델을 더욱 개선하려고 노력하고 있습니다. 이 베트남어 음성 비서의 안정성은 지속적인 교육과 제품 업그레이드를 통해 개선되고 있습니다.

분명 기술은 매일, 매시간 발전하고 있습니다. 2022년 말에 출시된 ChatGPT는 빅데이터가 어떻게 작동하는지에 대한 질문에 부분적으로 답합니다. 기술은 특히 이전에는 인간에게 크게 의존했던 교육과 언어 분야에서 삶의 한가운데로 '진입'하고 있습니다. 위에서 언급한 구체적인 사례에서 볼 수 있듯이 AI는 우리가 배우고, 일하고, 사는 방식을 새롭게 정의합니다.


[광고_2]
원천

댓글 (0)

No data
No data

같은 태그

같은 카테고리

판티엣의 많은 해변은 연으로 뒤덮여 있어 관광객들에게 깊은 인상을 줍니다.
러시아 군사 퍼레이드: 시청자들을 놀라게 한 '완전히 영화 같은' 각도
승전 80주년 기념 행사에서 러시아 전투기의 화려한 공연을 감상하세요
나비 시즌의 Cuc Phuong – 오래된 숲이 동화의 나라로 변하는 순간

같은 저자

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품