Исследование метода классификации новостей на основе дистрибутивной семантики

В статье рассматривается метод классификации новостей с использованием дистрибутивной семантики текста. Показано влияние признаков, полученных с использованием моделей дистрибутивной семантики, на метрики качества классификации. В качестве набора данных взят «The 20 Newsgroups dataset». Представлены результаты сравнительного анализа популярных классификаторов, таких как Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Study of the Method of Classification of News Based on Distributive Semantics

This paper is about a method for classifying news using the distributive semantics of the text. The influence of signs, features using models of distributive semantics, on the quality metrics of classification is shown. As a set of data was taken “The 20 Newsgroups dataset”. Presented results of a comparative analysis of popular classifiers, such as a Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Авторы
Издательство
РУДН
Язык
Русский
Страницы
219-221
Статус
Опубликовано
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
text classification; Svm; Knn; Rf; LR; distributive semantic; классификация текстов; дистрибутивная семантика
Дата создания
20.10.2018
Дата изменения
20.10.2018
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/14528/
Поделиться

Другие записи

Сингх Л., Молодченков А.И.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.. РУДН. С. 216-218
Демидова А.В., Дружинина О.В., Масина О.Н., Мияйлович Н., Ячимович М.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.. РУДН. С. 329-332