Использование ИИ для «обучения» вьетнамскому языку
Руководитель предприятия с прямыми иностранными инвестициями (ПИИ) во Вьетнаме хочет быстро выучить вьетнамский язык и читать 90% содержания обычных документов. Проблема в том, что он слишком занят и у него есть только около 1 часа (с 12 до 13 часов каждый день) на учебу. Итак, как следует применять технологии в программном обеспечении для изучения языков, чтобы помочь вам быстро выучить иностранные языки?
Выше приведена проблема позиции лидера компании прямых иностранных инвестиций, заданная доценту, доктору Динь Дьену, директору Центра компьютерной лингвистики Научного университета Вьетнамского национального университета в городе Хошимин.
Доцент Дьен отметил, что, как человек, имеющий множество тем научных исследований и международных публикаций по применению искусственного интеллекта (ИИ) в машинном переводе, критической лингвистике и преподавании вьетнамского языка иностранцам, приложения ИИ имеют важное значение для решения проблем в лингвистике.
В частности, первым шагом в изучении любого языка является обучение его звукам. Препятствием здесь является то, что во вьетнамском языке есть тоны и ритмы, поэтому преподавать его изучающим нетонетические языки, такие как английский, французский и т. д., будет очень сложно. Например, вместо того, чтобы спросить: «Ты уже идешь спать?» тогда ученик скажет: «Ты еще не дурак?», потому что он не может различать тоны. Их необходимо научить, куда ставить звук при произношении, какую форму держать рот и в чем разница между правильным и неправильным произношением.
В настоящее время прикладное программное обеспечение на основе искусственного интеллекта в преподавании иностранных языков может имитировать форму рта при чистке зубов и воспроизводить звуки, которые учащиеся могут имитировать. Затем учащийся воспроизводит звук, записывает его в программное обеспечение, использует технологию для сравнения произношения учащегося со стандартным произношением из программного обеспечения и быстро улучшает произношение. Все вышеперечисленные шаги требуют применения ИИ.
Другой пример, согласно вьетнамскому словарю Института языкознания под редакцией покойного профессора Хоанг Пхе, оригинальный вьетнамский словарь насчитывает около 34 000 слов. Расчеты показывают, что необходимо обучить машину примерно 10% слов, что эквивалентно эквивалентно 3400 словам прикладной информации, машина может прочитать около 90% обычного вьетнамского текста. Чтобы получить эту таблицу данных, доценту Дьену пришлось использовать ИИ для разметки словарной системы в корпусе вьетнамского языка.
Можно сказать, что ИИ изменил способ преподавания и обучения в сфере образования. Фактически, было создано множество приложений на основе искусственного интеллекта, призванных ускорить и сделать более эффективным процесс преподавания и обучения.
Приведенная выше интересная история объединения компьютерной науки и лингвистики показывает, что процесс обучения и применения ИИ на практике крайне необходим, но непрост. Данные необходимо разделить на несколько слоев идентификаторов, и каждый слой должен будет обрабатывать каждую переменную с различными конкретными идентификаторами.
Когда машины изучают язык...
Искусственный интеллект не только помогает людям изучать языки, но и помогает системам поддерживать более высокий уровень языкового интеллекта. Машины обучаются и совершенствуются каждый день.
Подобно истории доцента Дьена, ниже приведен еще один яркий пример того, как интеллектуальный помощник понимает человеческий язык.
Это процесс исследования и разработки вьетнамского голосового помощника Kiki для автомобилей, который будет хорошо распознавать голоса с различными региональными акцентами. В информатике распознавание речи является важным разделом искусственного интеллекта (ИИ), преобразующим человеческую речь в формат, удобный и понятный компьютерным приложениям. Эта технология является мостом взаимодействия между машинами и людьми. Голосовые помощники стали незаменимыми приложениями во всем мире. Наиболее популярные из них: Siri от Apple, Google Assistant, Amazon Alexa или Kiki во Вьетнаме.
Г-н Нгуен Хоанг Кхань Зуй, написавший первые строки кода для Kiki, рассказал, что для обучения модели искусственного интеллекта, достаточно интеллектуальной, чтобы распознавать голоса и предоставлять пользователям правильную информацию, ключевую роль играют языковые данные.
Например, очень важной функцией для пользователей вьетнамского помощника Kiki в автомобилях является навигация. Поэтому команда разработчиков продукта должна подготовить данные и словарь для «плавной» поддержки пользовательских команд. После сбора данных и обучения модели индекс качества распознавания речи в более поздней версии улучшился на 40% по сравнению с оригиналом.
Распознавание голоса в автомобилях не ограничивается только проблемами навигации и определения местоположения, но и многими другими проблемами.
Например, при использовании Kiki в автомобиле шум двигателя, ветра или дорожного оборудования на дороге также очень громкий, что напрямую влияет на качество распознавания голоса. Kiki в автомобиле. Поэтому команде Kiki пришлось попытаться решить проблему шума, улучшив данные, разговаривая в шумных условиях, чтобы максимально соответствовать реальной жизни.
Кроме того, благодаря новым технологиям, таким как самообучение, Кики пытается «учиться» даже на немаркированных данных, чтобы еще лучше улучшить модель. Стабильность работы этого вьетнамского голосового помощника улучшается благодаря постоянному обучению и обновлению продукта.
Очевидно, что технический прогресс происходит каждый день, каждый час. ChatGPT, запущенный в конце 2022 года, частично отвечает на вопрос, как работают большие данные. Технологии «вторгаются» в середину жизни, особенно в образование и язык — сферы, которые ранее в значительной степени зависели от человека. ИИ меняет то, как мы учимся, работаем, живем... как показывают приведенные выше конкретные примеры.
Источник
Comment (0)