VinBigdata는 8월 21일에 대규모 베트남어 모델의 성공적인 구축을 발표했으며, 이를 통해 생성적 AI 기술을 숙달할 수 있는 기반을 마련했습니다.
대규모 언어 모델(LLM)은 방대한 텍스트나 이미지 데이터세트에 대해 딥러닝 기술을 사용하여 학습된 모델입니다. 이 모델은 지식을 이해하고, 텍스트를 생성하고, 다양한 자연어 처리 작업을 수행할 수 있습니다. 이는 다양한 형태(텍스트, 이미지, 사운드 등)로 새로운 콘텐츠와 아이디어를 창출할 수 있는 생성적 AI 기술을 개발하는 데 중요한 열쇠로 여겨집니다.
VinBigdata는 대규모 베트남어 모델의 성공적인 구축을 바탕으로 VinBase(종합적 다중 인지 인공 지능 플랫폼)를 베트남의 생성적 AI 플랫폼으로 만드는 기술을 통합하고, 생성적 AI 챗봇, 콜봇, 차세대 ViVi 가상 비서 등 이 기술에 기반한 개발 솔루션을 제공할 예정입니다. 이 기술은 기계와의 자연스러운 소통을 높이는 동시에 사용자가 이전보다 더 빠르고 간편하게 정보를 검색하고 종합할 수 있도록 지원합니다.
Vu Ha Van 교수 - VinBigdata 회사의 과학 책임자. 사진: VinBigdata
VinBigdata 회사의 과학 책임자인 Vu Ha Van 교수는 세상에는 OpenAI의 ChatGPT나 Google의 Bard와 같이 대규모 언어 모델을 기반으로 제품을 연구하고 성공적으로 출시한 대기업이 많이 있다고 말했습니다. 베트남에서는 VinBigdata가 Vingroup으로부터 대규모 베트남어 모델 구축에 투자되었습니다. 반 씨에 따르면, 이 모델은 정확성 향상, 인프라 비용 절감, 보안 보장 등 세 가지 핵심 문제를 해결하는 데 중점을 두고 있습니다.
"VinBigdata는 ChatGPT와 같이 약 1,750억 개의 매개변수가 필요하지 않고, 수십억 개의 매개변수를 갖는 대규모 언어 모델을 만들 수 있으며, 베트남어 데이터와 베트남어 지식에 초점을 맞춰 매우 신뢰할 수 있는 문서를 생성할 수 있는 기능을 갖추고 있습니다."라고 해당 부서의 리더가 말했습니다.
기술을 습득하고, 첫 단계부터 자체 개발하고, 대규모 베트남어 모델을 구축한 것은 VinBigdata가 생성적 AI 기술을 시장의 제품 및 서비스 생태계에 도입하는 데 도움이 되는 진전으로 간주됩니다. 현재 회사는 VinBase KB(VinBase Knowledge Base Portal) 제품 라인에 새로운 기술을 처음으로 적용하고 있습니다. 이 제품은 지식 시스템의 방대한 데이터 세트에서 수집된 정보를 기반으로 정보를 검색하고 자동으로 답변을 생성할 수 있습니다.
VinBigdata 대표는 Generative AI를 발표하는 행사에서 다음과 같이 말했습니다. 사진: VinBigdata
올해 12월, Vingroup 회원사들은 VinBase2.0과 ViGPT 애플리케이션이라는 두 가지 주요 제품 라인을 출시할 것으로 예상됩니다. VinBase 2.0은 기업과 정부 기관을 위한 솔루션을 제공하는 다중인지 AI 플랫폼입니다. 한편, ViGPT 애플리케이션은 회사에서 "ChatGPT의 베트남 버전"으로 소개되었으며, 커뮤니티 접근 및 테스트를 위해 공개되었습니다. ViGPT를 사용하면 사용자는 베트남에 대한 구체적인 정보(규정, 법률 문서)나 지역 정보(역사, 문학, 명소, 지역 특산품)에 대해 질문하고 답할 수 있습니다.
VinBigdata 주식회사는 최대 3,500테라바이트 규모의 데이터베이스 시스템을 보유하고 있습니다. 이 시스템에는 수십만 시간 분량의 음성 데이터, 이미지, 정보가 저장되어 있으며, 이를 정제, 처리, 분류하여 AI 교육 및 R&D 인프라에 활용합니다. 인프라는 수십 개의 NvidiaDGX A100 서버 클러스터로 구성되어 있습니다. 이 회사는 또한 전 세계의 베트남 교수, 과학자, 기술 전문가로 구성된 팀을 소유하고 있습니다.
호아이 푸옹
[광고_2]
소스 링크
댓글 (0)