Исследование метода классификации новостей на основе дистрибутивной семантики

В статье рассматривается метод классификации новостей с использованием дистрибутивной семантики текста. Показано влияние признаков, полученных с использованием моделей дистрибутивной семантики, на метрики качества классификации. В качестве набора данных взят «The 20 Newsgroups dataset». Представлены результаты сравнительного анализа популярных классификаторов, таких как Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Study of the Method of Classification of News Based on Distributive Semantics

This paper is about a method for classifying news using the distributive semantics of the text. The influence of signs, features using models of distributive semantics, on the quality metrics of classification is shown. As a set of data was taken “The 20 Newsgroups dataset”. Presented results of a comparative analysis of popular classifiers, such as a Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Authors
Publisher
РУДН
Language
Russian
Pages
219-221
Status
Published
Organizations
  • 1 Peoples' Friendship University of Russia (RUDN University)
Keywords
text classification; Svm; Knn; Rf; LR; distributive semantic; классификация текстов; дистрибутивная семантика
Date of creation
20.10.2018
Date of change
20.10.2018
Short link
https://repository.rudn.ru/en/records/article/record/14528/
Share

Other records

Singh L., Molodchenkov A.I.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.. РУДН. P. 216-218
Demidova A.V., Druzhinina O.V., Masina O.N., Mijajlovic N., Jacimovic M.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.. РУДН. P. 329-332