Trong sự kiện Ngày Trí tuệ nhân tạo 2023 chủ đề “AI – tái thiết thực tại” diễn ra ngày 5 và 6-12, Công ty Nghiên cứu và ứng dụng trí tuệ nhân tạo VinAI (Tập đoàn Vingroup) đã công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt là PhởGPT.
PhởGPT là một dự án mã nguồn mở (Open-source) thay vì một phần mềm sở hữu riêng như ChatGPT của OpenAI. Vì là mã nguồn mở nên không giới hạn về tính thương mại, tất cả các bên đều có thể sử dụng PhởGPT để phát triển các ứng dụng cho mình, kể cả đơn vị ứng dụng cho mục đích thương mại. Tức đây như là một platform cung cấp cho cộng đồng đang phát triển các ứng dụng liên quan đến công nghệ AI ở trong nước.
Theo TS Bùi Hải Hưng, Tổng Giám đốc Công ty Nghiên cứu và ứng dụng trí tuệ nhân tạo VinAI, hạn chế của các mô hình tiếng Việt đã chứng minh các mô hình này chưa đạt được hiệu suất tối ưu và thiếu một bộ mã nguồn mở. Vì vậy, một trong những nhiệm vụ cấp bách đặt ra với cộng đồng AI nói chung, cộng đồng ngôn ngữ tự nhiên (NLP) nói riêng là xây dựng một mô hình mới, mạnh mẽ hơn, có khả năng xử lý ngôn ngữ tiếng Việt với độ chính xác và hiệu suất cao.
Các chuyên gia AI nhận định, với mô hình ngôn ngữ dữ liệu lớn có 7,5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer, mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng (Flash Attention), ngoại suy độ dài ngữ cảnh AliBi…
Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.
TS Bùi Hải Hưng nói thêm, PhởGPT được công ty phát triển từ đầu, độc lập với tất cả mô hình khác trên thế giới. Với mô hình mã nguồn mở, cộng đồng tại Việt Nam đều có thể sử dụng và cải thiện nó tốt hơn. Việc công khai mã nguồn PhởGPT và sẵn sàng cung cấp cho người dùng giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo.
Một trong những mục tiêu của mã nguồn mở là đặt ra nền tảng để mọi người không phải tốn công làm lại, các đơn vị có thể phát triển thêm mô hình ngôn ngữ lớn PhởGPT. Việc này sẽ giúp xã hội có một cộng đồng mã nguồn mở chất lượng cho mô hình ngôn ngữ lớn tiếng Việt, tạo ra hiệu ứng tốt để nhiều công ty có thể tham gia và ứng dụng vào một lĩnh vực nào đó. Với PhởGPT, Công ty Nghiên cứu và ứng dụng trí tuệ nhân tạo VinAI cho biết sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và gói giải pháp hỗ trợ chuyên sâu cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như y tế, giáo dục…
PhởGPT đã đặt những nền móng đầu tiên cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiệu quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ.
BÁ TÂN