Tính năng đáng chú ý nhất của VASA-1 chính là cho phép người dùng tạo hoạt ảnh cho bất kỳ hình ảnh nào. Họ có thể chụp ảnh một người và khiến người đó di chuyển một cách biểu cảm, nói chuyện và hát hò. Điều thú vị về giải pháp AI này là mức độ hiện thực cao mà nó mang lại.
Giải pháp VASA-1 tập trung vào việc cải thiện khả năng tiếp cận cho những người gặp khó khăn trong giao tiếp. Nó tìm cách cung cấp sự hỗ trợ đồng hành hoặc trị liệu cho những người cần nó, cho phép tạo ra những khuôn mặt nói chuyện thực tế trong thời gian thực. Yêu cầu của VASA-1 chỉ là hình ảnh khuôn mặt của người mà họ muốn thêm giọng nói. Ngoài ra, nó cho phép người dùng thêm các yếu tố khác để làm cho mọi thứ trở nên thực tế hơn. Người dùng cũng có thể chỉnh sửa vị trí của mắt hoặc chuyển động của miệng, khiến khuôn mặt cười hoặc hét lên.
Microsoft nhấn mạnh mức độ chân thực và sống động của những video này được tạo ra từ ảnh của một người, nhưng nó không chỉ là khả năng thêm giọng nói và các chuyển động dễ dàng, thực tế vào các bức vẽ hoặc ảnh nghệ thuật, VASA-1 có khả năng thêm cảm xúc, nét mặt và khả năng thêm chuyển động cho đầu.
Tuy nhiên, cũng giống như Sora của OpenAI, Microsoft cảnh báo rằng VASA-1 sẽ không thể truy cập được bởi họ sẽ không xuất bản bất kỳ bản demo, API, sản phẩm hoặc dịch vụ nào liên quan đến VASA-1. Có thể đây chỉ là phiên bản đầu tiên của công nghệ mới này và đang trong giai đoạn phát triển, đồng thời Microsoft lo ngại nguy cơ deepfake được sử dụng cho các mục đích xấu. Do đó, nó dường như chỉ được sử dụng trong các thỏa thuận với các trung tâm chuyên môn làm việc với những người có vấn đề giao tiếp khác nhau.
Có lẽ trong tương lai VASA-1 sẽ được triển khai, nhưng theo một cách được kiểm soát để tránh các vấn đề. Các cơ sở mà VASA-A hướng đến là các tổ chức công cộng có thể tạo ra những trợ lý ảo thân thiện với người dùng hơn, đồng thời cũng có thể là một tính năng bổ sung cho Copilot, tạo ra trợ lý ảo gần gũi ngay trong Windows.
Tuy nhiên, ngay cả những điều đó xảy ra, Microsoft cũng rất quan tâm đến vấn đề bảo mật nhằm tránh bị lợi dụng để sử dụng cho các nền tảng lừa đảo hoặc khuyến khích đầu tư vào các hoạt động lừa đảo.