Чат-боты черпают информацию в основном из Reddit и Wikipedia. Для географических данных они часто обращаются к Mapbox и OpenStreetMap.

Фото: unsplash
Большие языковые модели, такие как ChatGPT, активно используют социальную сеть Reddit и онлайн-энциклопедию Wikipedia для поиска фактической информации. Анализ компании Semrush показал, что более 40% ответов чат-ботов основано на данных из Reddit, а свыше 26% — на информации из Wikipedia. Эти платформы популярны из-за большого объема пользовательского контента, доступного для обработки, говорится в исследовании Semrush.
Для географических данных чат-боты часто обращаются к сервисам Mapbox и OpenStreetMap, которые предоставляют свободные картографические данные. Популярность Reddit и Wikipedia связана с их открытой структурой, где пользователи постоянно обновляют информацию. Однако это вызывает вопросы о точности и возможной предвзятости таких источников, так как их редактируют сами пользователи.
Ранее Bzzz.news сообщал, что платформа Reddit намерена превратиться в полноценную поисковую систему. Это поможет сохранить трафик пользователей, ищущих советы и ответы.