Недавно Baidu Baike — китайский аналог Википедии — обновил свой файл robots.txt, который указывает поисковым системам, к каким веб-адресам они могут получить доступ, и полностью заблокировал индексацию контента со своей платформы поисковыми системами Googlebot и Bingbot.
Фото: Shutterstock
Этот шаг демонстрирует усилия Baidu по защите своих онлайн-активов на фоне растущего спроса на большие данные для разработки моделей и приложений искусственного интеллекта (ИИ).
После обновления файла robots.txt компанией Baidu Baike, исследование SCMP показало, что многие записи с этой платформы по-прежнему отображаются в результатах поиска Google и Bing, возможно, из ранее заархивированного контента.
Спустя более двух лет после запуска OpenAI платформы ChatGPT многие крупнейшие мировые разработчики ИИ заключают соглашения с издателями контента, чтобы получить доступ к качественному контенту для своих проектов GenAI.
В июне компания OpenAI заключила соглашение с журналом Time о предоставлении доступа ко всему его архиву, охватывающему более 100 лет.
Као Фонг (по данным SCMP)
Источник: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html







Комментарий (0)