Всего несколько лет назад Китай мечтал о том, что в конечном итоге станет лидером в мировой гонке искусственного интеллекта, используя обширные данные страны для разработки таких приложений, как распознавание лиц.
Недавние разработки в области генеративного искусственного интеллекта — использование крупных моделей для создания такого контента, как текст, изображения и видео — изменили баланс, в результате чего Китай снова оказался отстающим.
Sora был запущен 16 февраля, поскольку Китай сталкивается с растущими проблемами, связанными с отсутствием доступа к передовым графическим процессорам (GPU) компании Nvidia из-за ужесточающихся экспортных ограничений США. Лучшие отечественные игроки в области искусственного интеллекта отстают от своих зарубежных коллег на несколько лет.
Чжоу Хунъи, основатель компании 360 Security Technology, занимающейся интернет-безопасностью, назвал Сору «ведром холодной воды, вылитым на Китай», сообщил новостной сайт Yicai 23 февраля. Он считает, что это помогает многим людям увидеть разрыв между ними и мировыми лидерами.
OpenAI пока не представила Sora широкой публике. В отличие от некоторых предыдущих моделей, это не версия с открытым исходным кодом. Доступ к исследованию Sora имеют лишь несколько человек.
В Китае Национальное управление киберпространства требует, чтобы все общедоступные большие языковые модели (LLM) были зарегистрированы в правительстве. Такие мировые имена, как OpenAI и Google, официально не предоставляли здесь свои услуги.
Это отсутствие привело к тому, что многим отечественным технологическим гигантам приходится конкурировать за место на рынке с более чем 200 степенями магистра права. Baidu, Tencent и Alibaba представили собственные программы LLM.
Однако очень немногие инструменты могут сравниться с Sora, отчасти потому, что они пока не используют новую архитектуру Diffusion Transformer (DiT). ByteDance — материнская компания TikTok — заявила, что ее внутренний инструмент управления движением в видео Boximator, используемый для поддержки создания видео, все еще находится в начальной стадии развития и не готов к массовому выпуску.
Компания признает, что между Boximator и ведущими моделями для создания видео существует большой разрыв с точки зрения качества изображения, точности и продолжительности.
Вместо того чтобы догнать Сору, некоторые представители отрасли видят более насущную проблему в получении доступа к моделям OpenAI. Однако американские законодатели стремятся ограничить доступ Китая к своим облачным сервисам ИИ.
Один из возможных путей для китайских инженеров ИИ — «сначала декодировать Sora и обучить его с помощью собственных данных, чтобы создать аналогичный продукт», — рассказал SCMP неназванный китайский разработчик. Сюй Лян, предприниматель в сфере искусственного интеллекта из Ханчжоу, считает, что в скором времени в Китае появятся аналогичные сервисы, хотя между китайскими продуктами и Sora все еще может существовать небольшой разрыв.
Ван Шуйи, профессор, специализирующийся на ИИ и машинном обучении в Тяньцзиньском педагогическом университете (TJNU), прокомментировал: опыт разработки LLM за последний год позволил китайским крупным технологическим компаниям накопить знания в этой области и запастись необходимым оборудованием, что позволяет им для производства таких продуктов, как Sora, в течение следующих 6 месяцев.
За несколько месяцев до запуска Sora группа исследователей выпустила VBench — инструмент для сравнительного анализа моделей генерации видео. Команда VBench, в которую входят исследователи из Наньянского технологического университета в Сингапуре и Шанхайской лаборатории искусственного интеллекта в Китае, обнаружила, что Sora превосходит другие модели по общему качеству видео. , на основе демонстраций, предоставленных OpenAI.
Лу Янься, директор по исследованиям новых технологий IDC China, сказал, что такие технологические гиганты, как Baidu, Alibaba и Tencent, будут одними из первых, кто запустит подобные сервисы в стране. Это.
Кроме того, по ее словам, к гонке также присоединятся iFlyTek, SenseTime и Hikvision, которые все находятся в санкционном списке Вашингтона.
Однако, по мнению аналитиков, Китаю по-прежнему предстоит нелегкая борьба, поскольку его технологический рынок становится все более изолированным от мира с точки зрения капитала, оборудования, данных и даже людей.
Разрыв в рыночной стоимости между ведущими технологическими компаниями Китая и США, такими как Microsoft, Google и Nvidia, значительно увеличился за последние годы, поскольку Пекин усилил контроль над отраслью.
Кроме того, хотя когда-то считалось, что Китай имеет преимущество с точки зрения количества данных, Лу отметил, что сейчас страна сталкивается с нехваткой качественных данных, необходимых для обучения новых моделей, а также с проблемой ограниченного доступа к передовым чипам.
По словам руководителей IDC, еще одной проблемой является нехватка талантов, поскольку лучшим и самым ярким специалистам в области ИИ зачастую легче проявить себя, работая на ведущих игроков в США. Например, в OpenAI основную команду составляют технические эксперты из Китая. Из 1677 членов-партнеров OpenAI в LinkedIn 23 учились в Университете Цинхуа.
Однако даже при наличии достаточного количества талантов эксперты сомневаются, насколько далеко может зайти китайский искусственный интеллект, учитывая существующие ограничения, связанные с торговой напряженностью между США и Китаем.
В своем отчете компания Ping An Securities предупредила, что продолжение усилий по ограничению экспорта чипов из США может ускорить развитие китайской индустрии чипов искусственного интеллекта, однако «отечественные альтернативы» могут не оправдать ожиданий.
Вашингтон заблокировал китайским компаниям доступ к самым передовым в мире полупроводниковым приборам. В октябре 2023 года США снова ужесточили правила, заблокировав на материке доступ к графическим процессорам, которые Nvidia разработала специально для китайских клиентов, чтобы обойти предыдущие ограничения.
Александр Харроуэлл, продвинутый аналитик в области вычислений из исследовательской и консалтинговой группы Omdia, отметил, что в Китае есть варианты обучения LLM не только с использованием графических процессоров, но и с использованием TPU от Google, Ascend от Huawei, Trainium от AWS или многих других стартап-продуктов. Однако это потребует больше усилий по разработке программного обеспечения и администрированию системы.
По словам предпринимателя Сюй, у китайского рынка появятся особые возможности, когда будут опубликованы технические отчеты о Sora и модели видео с открытым исходным кодом. «Будет платформа, на которой китайские компании смогут учиться», — сказал он. Местные видеомодели также лучше поддерживают китайский язык, добавил он.
(По данным SCMP)
Источник
Comment (0)