Эксперты раскрыли, какие сайты кормят искусственный интеллект

Чат-боты черпают информацию в основном из Reddit и Wikipedia. Для географических данных они часто обращаются к Mapbox и OpenStreetMap.

Эксперты раскрыли, какие сайты кормят искусственный интеллект

Фото: unsplash

Большие языковые модели, такие как ChatGPT, активно используют социальную сеть Reddit и онлайн-энциклопедию Wikipedia для поиска фактической информации. Анализ компании Semrush показал, что более 40% ответов чат-ботов основано на данных из Reddit, а свыше 26% — на информации из Wikipedia. Эти платформы популярны из-за большого объема пользовательского контента, доступного для обработки, говорится в исследовании Semrush.

Для географических данных чат-боты часто обращаются к сервисам Mapbox и OpenStreetMap, которые предоставляют свободные картографические данные. Популярность Reddit и Wikipedia связана с их открытой структурой, где пользователи постоянно обновляют информацию. Однако это вызывает вопросы о точности и возможной предвзятости таких источников, так как их редактируют сами пользователи.

Ранее Bzzz.news сообщал, что платформа Reddit намерена превратиться в полноценную поисковую систему. Это поможет сохранить трафик пользователей, ищущих советы и ответы.