Study of the Method of Classification of News Based on Distributive Semantics

Skrinnik, K.V.

Исследование метода классификации новостей на основе дистрибутивной семантики

В статье рассматривается метод классификации новостей с использованием дистрибутивной семантики текста. Показано влияние признаков, полученных с использованием моделей дистрибутивной семантики, на метрики качества классификации. В качестве набора данных взят «The 20 Newsgroups dataset». Представлены результаты сравнительного анализа популярных классификаторов, таких как Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Study of the Method of Classification of News Based on Distributive Semantics

This paper is about a method for classifying news using the distributive semantics of the text. The influence of signs, features using models of distributive semantics, on the quality metrics of classification is shown. As a set of data was taken “The 20 Newsgroups dataset”. Presented results of a comparative analysis of popular classifiers, such as a Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Авторы

Скрынник К.В. (Skrinnik K.V.) ¹

Сборник материалов конференции

Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.

Издательство

РУДН

Язык

Русский

Страницы

219-221

Статус

Опубликовано