Chỉ vài năm trước, Trung Quốc còn hình dung mình cuối cùng sẽ thống trị cuộc đua AI toàn cầu bằng cách tận dụng kho dữ liệu khổng lồ của đất nước để phát triển các ứng dụng như nhận dạng khuôn mặt.

Những phát triển gần đây trong AI tạo sinh – sử dụng các mô hình lớn để sản xuất nội dung như văn bản, hình ảnh và video – đã thay đổi cán cân, khiến Trung Quốc một lần nữa trông giống như một kẻ tụt hậu.

Sora ra mắt ngày 16/2 trong bối cảnh Trung Quốc đối mặt với thách thức ngày càng lớn từ không được tiếp cận bộ xử lý đồ họa (GPU) tiên tiến của Nvidia do Mỹ leo thang các biện pháp hạn chế xuất khẩu. Những người chơi AI giỏi nhất trong nước đi sau vài năm so với các đồng nghiệp nước ngoài.

Zhou Hongyi, nhà sáng lập hãng bảo mật Internet 360 Security Technology, gọi Sora là “thùng nước lạnh dội xuống đầu Trung Quốc”, trang tin Yicai đưa tin hôm 23/2. Ông cho rằng nó giúp cho nhiều người nhìn ra được khoảng cách giữa họ với những người dẫn đầu thế giới.

Hiện tại, OpenAI chưa công bố Sora cho công chúng. Nó không phải mã nguồn mở như một số mô hình trước đó. Chỉ có số ít người có quyền truy cập bản dùng thử Sora.

w9xz2qt5.png
Sora của OpenAI giúp công nghệ Trung Quốc nhận ra khoảng cách giữa họ với các công nghệ AI hàng đầu thế giới. (Ảnh: SCMP)

Tại Trung Quốc, Cục Quản lý Không gian mạng Quốc gia yêu cầu tất cả các mô hình ngôn ngữ lớn (LLM) công khai phải đăng ký với chính quyền. Những tên tuổi lớn của thế giới như OpenAI, Google đều chưa chính thức cung cấp dịch vụ tại đây.

Sự vắng mặt này dẫn đến nhiều “ông lớn” công nghệ nội tranh giành vị trí trong thị trường với hơn 200 LLM. Baidu, Tencent và Alibaba đều đã giới thiệu LLM riêng.

Tuy nhiên, rất ít công cụ có thể sánh được với Sora, một phần vì chưa sử dụng kiến trúc Diffusion Transformer (DiT) mới. ByteDance – công ty mẹ tikTok – cho biết công cụ điều khiển chuyển động video nội bộ Boximator, được sử dụng để hỗ trợ tạo video, vẫn còn trong giai đoạn trứng nước và chưa sẵn sàng để phát hành hàng loạt.

Công ty này thừa nhận có khoảng cách lớn giữa Boximator với các mô hình tạo video hàng đầu về chất lượng hình ảnh, độ trung thực và thời lượng.

Thay vì bắt kịp Sora, một số doanh nghiệp trong ngành xem vấn đề cấp bách hơn là giành quyền truy cập mô hình của OpenAI. Song, các nhà lập pháp Mỹ đang tìm cách hạn chế Trung Quốc truy cập các dịch vụ đám mây AI của mình.

Một nhà phát triển Trung Quốc giấu tên chia sẻ với SCMP rằng một con đường khả thi cho các kỹ sư AI Trung Quốc là “trước tiên giải mã Sora và đào tạo nó bằng dữ liệu của riêng họ để tạo ra một sản phẩm tương tự”. Xu Liang, doanh nhân AI có trụ sở tại Hàng Châu, tin rằng không lâu nữa, Trung Quốc sẽ có các dịch vụ tương tự dù vẫn có thể có một khoảng cách không đáng kể giữa các sản phẩm Trung Quốc và Sora.

Wang Shuyi, Giáo sư chuyên về AI và học máy tại Đại học Sư phạm Thiên Tân (TJNU), nhận xét: kinh nghiệm phát triển LLM trong năm qua đã cho phép các Big Tech Trung Quốc bồi đắp kiến thức trong lĩnh vực này và dự trữ phần cứng cần thiết, giúp họ có thể sản xuất các sản phẩm giống như Sora trong 6 tháng tới.

Vài tháng trước khi Sora ra mắt, một nhóm các nhà nghiên cứu đã ra mắt VBench, một công cụ đo điểm chuẩn cho các mô hình tạo video. Nhóm VBench, bao gồm các nhà nghiên cứu từ Đại học Công nghệ Nanyang của Singapore và Phòng thí nghiệm Trí tuệ nhân tạo Thượng Hải ở Trung Quốc, phát hiện Sora vượt trội về chất lượng video tổng thể khi so sánh với các mô hình khác, dựa trên các bản demo do OpenAI cung cấp.

Lu Yanxia, Giám đốc nghiên cứu của IDC Trung Quốc về công nghệ mới nổi, cho biết những “gã khổng lồ” công nghệ như Baidu, Alibaba và Tencent sẽ nằm trong số những người đầu tiên triển khai các dịch vụ tương tự ở nước này.

Ngoài ra, iFlyTek, SenseTime và Hikvision – tất cả đều có tên trong danh sách cấm vận của Washington – cũng sẽ tham gia cuộc đua, bà nói.

Song, Trung Quốc vẫn phải đối mặt với một trận chiến khó khăn khi thị trường công nghệ của nước này ngày càng trở nên xa cách với thế giới về vốn, phần cứng, dữ liệu và thậm chí cả con người, theo các nhà phân tích.

Khoảng cách giá trị thị trường giữa các công ty công nghệ hàng đầu của Trung Quốc so với các công ty ở Mỹ như Microsoft, Google và Nvidia đã gia tăng đáng kể trong những năm gần đây, kể từ khi Bắc Kinh siết chặt quản lý.

Ngoài ra, dù Trung Quốc từng được coi là có lợi thế về số lượng dữ liệu, ông Lu chỉ ra nước này hiện đang phải đối mặt với sự khan hiếm dữ liệu chất lượng cần thiết để đào tạo các mô hình mới hơn, cộng với thách thức từ khả năng tiếp cận hạn chế với các chip tiên tiến.

Thiếu nhân tài là một mối lo ngại khác, theo lãnh đạo IDC, vì những người giỏi nhất và sáng giá nhất trong lĩnh vực AI thường dễ dàng tỏa sáng hơn khi làm việc cho những người chơi hàng đầu ở Mỹ. Chẳng hạn, tại OpenAI, các chuyên gia công nghệ từ Trung Quốc tạo thành một nhóm chủ chốt. Trong số 1.677 thành viên liên kết của OpenAI trên LinkedIn, 23 người trong số họ đã học tại Đại học Thanh Hoa.

Tuy nhiên, ngay cả khi có đủ nhân tài, các chuyên gia đặt câu hỏi AI phát triển trong nước của Trung Quốc có thể đi bao xa trong khi phải đối mặt với những hạn chế hiện có từ căng thẳng thương mại Mỹ – Trung.

Trong một báo cáo, hãng chứng khoán Ping An cảnh báo nỗ lực tiếp tục hạn chế xuất khẩu chip từ Mỹ có thể tăng tốc sự trưởng thành của ngành công nghiệp chip AI Trung Quốc, nhưng “các lựa chọn thay thế cây nhà lá vườn trong nước có thể không đạt được kỳ vọng”.

Washington đã chặn các công ty Trung Quốc tiếp cận các công cụ bán dẫn tiên tiến nhất thế giới. Vào tháng 10/2023, Mỹ một lần nữa thắt chặt quy định, chặn quyền truy cập của đại lục vào GPU mà Nvidia đã thiết kế đặc biệt cho khách hàng Trung Quốc để tránh những hạn chế trước đó.

Alexander Harrowell, nhà phân tích điện toán tiên tiến tại nhóm nghiên cứu và tư vấn công nghệ Omdia, lưu ý rằng Trung Quốc có các lựa chọn ngoài GPU để đào tạo LLM như TPU của Google, Ascend của Huawei, Trainium của AWS hoặc một trong khá nhiều sản phẩm của các startup. Dù vậy, sẽ tốn nhiều công sức hơn trong việc phát triển phần mềm và quản trị hệ thống.

Thị trường Trung Quốc sẽ có những cơ hội đặc biệt, theo doanh nhân Xu, khi các báo cáo kỹ thuật về Sora và mô hình video nguồn mở được công bố. “Sẽ có nền tảng cho các công ty Trung Quốc học hỏi”, ông nói. Các mô hình video địa phương cũng hỗ trợ tiếng Trung tốt hơn, ông nói thêm.

(Theo SCMP)