Задача кластеризации текстовых документов

В статье рассмотрены вопросы совершенствования технологии кластеризации текстовых документов на основе оптимизации числа кластеров и их первоначального размещения, а также выбора наиболее адекватных метрик. Полученные в ходе экспериментов результаты подтверждают эффективность предложенного подхода.

The task of clusterization of text documents

Improvement of text documents clusterization technology based on number clusters optimization and their initial allocation, and also a choice of the most adequate metrics are considered. The results received during experiments confirm efficiency of the offered approach.

Authors
Publisher
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук
Number of issue
2
Language
Russian
Pages
42-49
Status
Published
Year
2010
Organizations
  • 1 Российский университет дружбы народов
Keywords
text; class; vector; metrics; centre of cluster; experiment; data clustering; heading; текст; кластеризация; класс; вектор; метрика; центр кластера; рубрика; эксперимент
Share

Other records