Тот факт, что Google интегрировал Bard во многие приложения, такие как Gmail, YouTube, Google Maps и Flights, является большим преимуществом перед ChatGPT. Недавно компания OpenAI объявила, что бесплатная версия ChatGPT вскоре позволит вводить данные голосом и изображениями.
Это значит, что пользователи могут задавать вопросы ChatGPT более естественным образом, чем при наборе текста на iPhone и Android, или даже использовать изображения для получения более точных ответов. Главное, что пользователям не придется платить за ChatGPT Plus, чтобы получать обновления, хотя платные аккаунты станут первой группой, которая получит пробную версию.
Пользователи учетных записей Plus и Enterprise получат это обновление в течение следующих двух недель, а затем и другие группы пользователей, включая разработчиков. Использование изображений для ввода в ChatGPT — это принцип работы мультимодальных моделей ИИ. Это похоже на то, как поисковый гигант использует Google Lens с ИИ.
Ожидается, что две новые функции ChatGPT привлекут больше пользователей, чем Google Bard
Между тем функция голосовой поддержки будет доступна только в приложении ChatGPT для iPhone и Android. Пользователям просто нужно включить ее в настройках приложения после открытия этой функции. По данным OpenAI, ChatGPT достаточно всего нескольких секунд речевого образца, чтобы сгенерировать из текста звук, похожий на человеческий, и для этого используется новая модель преобразования текста в речь.
Технология способна генерировать реалистичные синтетические голоса из реальной речи за считанные секунды, открывая двери для множества инновационных и ориентированных на доступность приложений. Однако это также создает новые риски, такие как возможность выдачи себя за известных людей или совершения мошенничества. OpenAI также заявила, что сотрудничает со Spotify для тестирования функции голосового перевода подкастов, которая позволит создателям переводить свой контент на другие языки, используя собственный голос.
Ссылка на источник
Комментарий (0)