Мурманские ученые создали программу, отслеживающую появление новых слов и исчезновение старых в русском языке. По данным Минобрнауки, программа действительно демонстрирует рост частотности употребления некоторых слов и снижение притока новых лексем.
Фото: unsplash
Мурманские исследователи разработали программу, которая фиксирует появление новых слов и исчезновение устаревших в русском языке. Согласно данным Минобрнауки, система подтверждает увеличение частоты использования некоторых слов и снижение ввода новых лексем, сообщила пресс-служба Мурманского арктического университета.
Технология работает как цифровой фильтр, анализируя большие массивы текстов. Метод протестировали на диахронических корпусах Национального корпуса русского языка, содержащих более 250 млн слов. Анализ охватывал три исторических периода: досоветский (1700-1916), советский (1918-1991) и постсоветский (1992-2016). Алгоритм преобразует слова в начальную форму, подсчитывает все варианты их употребления и сравнивает частотность по эпохам.
Ученые отмечают, что число неологизмов уменьшается, но активный словарь растет, то есть люди все чаще используют ограниченный набор слов. Также зафиксирован рост числа цифр в текстах.
Специалисты считают, что полученные данные помогут точнее прогнозировать развитие языка и улучшить модели искусственного интеллекта, обучая их понимать динамику лексических изменений.
Ранее Bzzz.news сообщал, что ученые обучили ИИ обнаруживать диабет и болезни сердца по голосу.



