위의 내용은 최근 ViGPT 출시 이벤트의 sidelines에서 기자들과의 토론에서 VinBigdata의 과학 책임자인 Vu Ha Van 교수가 공유한 것입니다.

안흐부하반.jpg
VinBigdata의 최고 과학 책임자, Vu Ha Van 교수.

ViGPT에는 기술자와 커뮤니티의 기여가 필요합니다.

부 하 반 교수는 구글과 같은 대기업의 경우 주요 언어를 개발할 때 영어나 프랑스어를 주요 언어로 선택할 것이라고 말했습니다. 베트남어도 있지만 검색 결과나 조회는 다른 언어에 비해 비교적 느릴 것입니다. 어느 정도까지 이러한 대규모 언어 모델의 베트남어 질문에 대한 답변은 완전하고 정확하지 않을 수 있습니다.

따라서 VinBigdata는 시간이 지남에 따라 ViGPT가 문화, 역사, 지리 등 베트남 사람만의 특성과 속성을 지닌 정보와 직접적으로 관련된 질문에 대한 정확도 면에서 ViGPT를 앞지르기를 기대합니다. 이것이 바로 베트남어 모델을 만든 사람들이 앞으로 베트남 사람들에게 질문할 때 원하고 목표로 하는 바이며, 외국어보다 더 나은 비교 자료가 될 것입니다.

더 깊이 들어가 보면, VinBigdata의 과학 책임자는 예를 들어 "민감한" 정치적 시기에 Truong Sa와 Hoang Sa의 역사에 대한 질문을 분석했습니다. Google이나 OpenAI의 답변에 이러한 회사 설립자나 그 배후에 있는 사람들의 정치적 편견이 반영되지 않았다고 보장하는 것은 매우 어렵습니다. 베트남에는 다른 선택지도 있는데, 그 점도 생각해 보는 게 좋을 것 같아요.

"베트남 사람들을 위한 대규모 언어 모델을 구축하는 목적은 베트남 사람들에게 최상의 답변을 제공하는 것입니다. 우리는 그들의 목적을 알 수 없습니다." Vu Ha Van 교수가 공유했습니다.

물론, ViGPT가 현재 ChatGPT나 Google Bard만큼 잘 할 수 없는 일이 많습니다. 이러한 사업의 투자 비율과 구현에 걸리는 시간이 ViGPT의 수천 배나 더 높기 때문입니다. 하지만 부 하 반 교수는 "6개의 황금 글자가 수놓여진 국기는 누구의 국기인가?"와 같이 베트남에 편향된 일부 질문에 대해서는 ViGPT가 그 국기가 쩐 꾸옥 토안의 국기라고 답할 것이고 다른 버전은 틀릴 수 있다고 말했습니다. 앞으로 이와 같은 심도 있는 질문을 통해 국내 사용자들의 피드백이 있다면 ViGPT는 더 나은 성과를 거둘 수 있을 것입니다.

"사용자들이 그저 비판만 하거나, 10살짜리 아이가 모르는 질문을 알고 있을 때 이 거대한 언어 모델이 여전히 어리석다고 생각하거나, 우리가 AI보다 더 똑똑하다는 것을 증명하기 위해 속임수 질문을 하는 경우, 우리는 AI보다 똑똑하지만, 그것은 어떤 목적을 위한 것이 아닙니다. 우리가 제품을 개선하려는 것이 아니라, 제품을 만드는 사람들을 더 슬프게 만들려는 것입니다. 따라서 VinBigdata는 기술 직원과 커뮤니티의 공동 기여가 필요합니다. 우리는 베트남 사람들의 동반자가 필요하며, 제품을 완성하여 서비스 도구일 뿐만 아니라 베트남 사람들의 자부심이 되도록 해야 합니다." Vu Ha Van 교수는 강조했습니다.

베트남어 모델 지원 및 동반 준비

VietNamNet 과의 인터뷰에서 베트남에서 AI를 개발하는 스타트업 대표자들은 VinBigdata의 베트남어 모델을 지원하고 수반할 준비가 되었다고 말했습니다.

비GPT.jpg
ViGPT를 지원하고 수반하는 것은 대규모 베트남어 모델을 개발하는 데 필수적입니다.

Aicontent.vn 플랫폼의 소유자인 Unikon 주식회사의 기술 책임자인 Dinh Tran Tuan Linh 씨는 현재 아시아에서 중국, 한국, 일본이 선두를 달리고 있는 가운데 자체 대규모 언어 모델을 성공적으로 훈련하려는 노력을 한 나라는 많지 않다고 말했습니다. 따라서 ViGPT는 베트남 국민이 핵심 기술에 투자하려는 노력에 중요한 신호입니다. Dinh Tran Tuan Linh 씨에 따르면, 천 마일의 모든 여행은 첫 걸음부터 시작해야 합니다. AI 애플리케이션의 선구자인 Unikon은 적절한 규모의 일부 프로젝트에서 ViGPT를 기여, 테스트, 피드백을 제공하고 심지어 실험적으로 사용할 의향이 있습니다.

한편, Lovinbot의 공동 창립자인 Dang Huu Son 씨는 VinBigdata가 커뮤니티와 전문가의 의견을 경청하는 것은 베트남인을 위한 대규모 언어 모델을 개발하는 데 매우 좋은 일이라고 말했습니다. 기술자인 Dang Huu Son 씨는 제품 사용 후 VinBigdata 기술팀에 피드백을 제공했습니다.

당 후 손 씨에 따르면, 새로 출시한 제품은 당장 완성할 수 없지만, 커뮤니티의 전폭적인 지원을 당장 받을 수도 없습니다. 베트남 사람들은 오랫동안 베트남이 그 기술을 할 수 없다고 생각해 왔기 때문에 아직 시간이 필요하다고 생각했기 때문입니다. 동시에, VinBigdata는 커뮤니티가 어떻게 서로를 더 잘 지원하고 동행할 수 있는지에 대한 구체적인 지침이 필요합니다.

마인드메이드 플랫폼 창립자인 당 후 록(Dang Huu Loc) 씨는 현재 전 세계적으로 모국어 모델을 구축한 국가가 매우 적다고 말했습니다. 인도처럼 정보기술이 강력한 부유한 나라도, 인도네시아나 중동처럼 베트남보다 GDP가 높은 나라도... 그저 하고 싶다고 해서 할 수 있는 것은 아니다. 언어적 특성에 따라서도 달라지기 때문이다. 따라서 더 넓은 관점에서 볼 때, 베트남은 대규모 토착어 모델을 구축하는 데 전략적 이점이 있으며, 이는 베트남인이 전 세계적으로 경쟁할 수 있는 전략적 이점이 될 것입니다.

당 후 록 씨에 따르면, 대규모 베트남어 모델을 구축하려는 모든 노력은 가치 있고, 모델을 매일 더욱 완전하게 만들기 위해 특정 방식으로 논평해야 하며, 현재의 단점을 이용해 국내 기술 단위의 모든 노력을 무시해서는 안 됩니다. 베트남 국민도 AI 시대에 대언어 기술의 중요성에 대해 더 널리 알리고, 이를 적용하여 베트남 기업과 자신을 위해 가치를 창출하는 방법에 대해 더 많이 논의해야지, 베트남 대언어 모델을 현재 세계 최고의 대언어 모델과 비교하는 것에 그치지 말아야 합니다. 큰 언어는 일반적인 AI이기 때문에 어떤 한 가지 문제에는 적합하지 않더라도 다른 특정 문제에는 적합할 수 있습니다. 특히, 베트남어 대규모 언어 모델은 베트남어를 이해하고 생성하는 데 관련된 문제에서 더 나은 이점을 가질 것입니다.

ViGPT 커뮤니티 버전은 비영리 단체에 무료로 제공됩니다 . ViGPT 커뮤니티 버전은 VinBigdata에서 비영리 단체에 무료로 제공됩니다. 그러나 이 버전을 사용하는 유닛은 배포 시 클라우드 및 기타 리소스와 같은 인프라 비용을 지불해야 합니다.