Zalo AI의 "GenZ" 엔지니어인 Le Duy Khanh 이 실시간 음성 인식 모델(스트리밍 자동 음성 인식)의 정확도를 높이는 연구 프로젝트를 진행 중이며 , 이 프로젝트는 2024년 9월 그리스에서 열리는 국제 과학 컨퍼런스에서 처음 발표될 예정입니다.
2000년생 Zalo AI 엔지니어의 연구 논문은 " 시간 이동식 문맥적 주의와 동적 우측 문맥 마스킹을 통한 스트리밍 음성 인식 개선 " 이라는 주제 로 거의 만점인 11/12점을 받았으며, 구두 세션 형태로 Interspeech 컨퍼런스에서 발표되는 2,000편 이상의 참가 논문과 함께 엄격한 심사 과정을 통과했습니다.
Le Duy Khanh은 " 저는 저의 첫 번째 과학 논문이 권위 있는 과학 학회에서 인정을 받았다는 사실이 매우 자랑스럽고, 베트남의 연구 성과를 거대 기술 기업, 전문가 및 국제 사회에 소개할 기회를 얻었습니다 ."라고 말했습니다.
Zalo AI의 연구개발부장이자 호치민시 국립대학교 과학대학 강사인 Chau Thanh Duc 박사의 지도 하에 , 이 연구 프로젝트는 음성 인식 모델을 업그레이드하고 Zalo 애플리케이션의 음성 받아쓰기 및 음성-텍스트 변환의 정확도를 높이는 데 중요한 기여를 할 것으로 기대됩니다.
“ Zalo AI의 매우 실용적인 연구를 과학 논문으로 종합하고 이를 권위 있는 국제 학회에서 발표하는 것은 매우 큰 의미가 있습니다. 이는 베트남 엔지니어들의 역량을 입증할 뿐만 아니라, 경험을 공유하고 글로벌 AI 커뮤니티의 발전에 기여하려는 의지를 보여줍니다."라고 박사 는 말했습니다. Chau Thanh Duc이 말했다.
이전에 Zalo는 2023년 말부터 이 연구를 자사 메시징 애플리케이션에 통합하여 "음성 메시지 작성" 기능의 정확도를 크게 향상시켰습니다. 이 기능을 사용하면 사용자는 입력하는 대신 음성으로 메시지를 작성할 수 있어 시간을 절약하고 다양한 사용 상황에서 더욱 편리하게 사용할 수 있습니다. 동시에 이 기능의 정확도는 실제로 95%에 도달했습니다. 음성으로 작성한 후 텍스트를 다시 편집해야 하는 비율은 6.4%에서 4.8%로 감소했습니다.
Zalo 통계에 따르면, 이 기능은 아직 시험 단계이기는 하지만 하루에 약 450만 개의 메시지를 생성했고, 월간 사용자 수는 약 320만 명이었습니다(2024년 6월까지 데이터 업데이트).
2017년 AI 연구 분야에서 선구적인 여정을 시작한 이래로 Zalo는 항상 젊은 세대에게 "힘을 실어주는 것"을 믿어 왔습니다. 현재 Zalo 직원의 최대 31%가 GenZ 세대에 속합니다. 2021년에는 Zalo AI 엔지니어링 팀의 음성 처리 기술과 관련된 두 가지 다른 연구 주제도 아시아 태평양 인공지능 국제회의(PRICAI 2021)에서 인정을 받았습니다. 주목할 점은 이 두 주제의 저자가 모두 30세 미만의 젊은 연구자라는 점입니다.
Interspeech는 국제 음성 커뮤니케이션 협회가 주관하는 음성 처리 분야의 오랜 역사를 가진 포괄적이고 권위 있는 국제 학술대회입니다. 올해 " Speech and beyond " 라는 주제의 컨퍼런스는 2024년 9월 1일~5일까지 코스 섬(그리스)에서 개최됩니다.
댓글 (0)