Недавно Baidu Baike — китайский сервис, похожий на Википедию, — обновил свой файл robots.txt — файл, который сообщает поисковым системам, к каким веб-адресам они могут получить доступ, — и полностью заблокировал Googlebot и Bingbot возможность индексировать контент с этой платформы.
Фото: Shutterstock
Этот шаг демонстрирует усилия Baidu по защите своих онлайн-активов на фоне растущего спроса на большие данные для разработки моделей и приложений искусственного интеллекта (ИИ).
После обновления robots.txt на Baidu Baike расследование SCMP показало, что многие элементы платформы по-прежнему появляются в результатах поиска Google и Bing, вероятно, из ранее заархивированного старого контента.
Спустя два года после того, как OpenAI запустила ChatGPT, многие ведущие мировые разработчики искусственного интеллекта заключают соглашения с издателями контента для доступа к качественному контенту для своих проектов GenAI.
В июне компания OpenAI подписала соглашение с журналом Time о доступе ко всему архиву журнала, охватывающему более чем 100-летнюю историю.
Као Фонг (по данным SCMP)
Источник: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html
Комментарий (0)