В статье представлены результаты исследования в области классификации коротких текстовых документов. Проанализированы методы классификации на основе анализа распределения лексических дескрипторов естественного языка. Описан метод оценки информационной значимости в текстах естественного языка. Представлен метод классификации текстовых документов на основе характеристики тематической значимости.
The article covers short text classification method based on different measures of similarity word distribution. The work presents the text classification method based on a new lexical descriptor information gain concept and a topic importance characteristic. The results of experiments are presented.