Метод автоматической классификации коротких текстовых сообщений

В статье представлены результаты исследования в области классификации коротких текстовых документов. Проанализированы методы классификации на основе анализа распределения лексических дескрипторов естественного языка. Описан метод оценки информационной значимости в текстах естественного языка. Представлен метод классификации текстовых документов на основе характеристики тематической значимости.

Short text messages classification method

The article covers short text classification method based on different measures of similarity word distribution. The work presents the text classification method based on a new lexical descriptor information gain concept and a topic importance characteristic. The results of experiments are presented.

Publisher
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук
Issue number
3
Language
Russian
Pages
93-102
State
Published
Year
2012
Organizations
  • 1 Российский университет дружбы народов
  • 2 МГУ им. Ломоносова
  • 3 ИСА РАН
Keywords
short text classification; metadata based classification; tf; IDF; svm; topic importance characteristic; классификация коротких текстовых документов; классификация по метаданным; мультиномиальная модель; метод опорных векторов; характеристика тематической значимости
Share

Other records