Задача кластеризации текстовых документов

В статье рассмотрены вопросы совершенствования технологии кластеризации текстовых документов на основе оптимизации числа кластеров и их первоначального размещения, а также выбора наиболее адекватных метрик. Полученные в ходе экспериментов результаты подтверждают эффективность предложенного подхода.

The task of clusterization of text documents

Improvement of text documents clusterization technology based on number clusters optimization and their initial allocation, and also a choice of the most adequate metrics are considered. The results received during experiments confirm efficiency of the offered approach.

Авторы
Издательство
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук
Номер выпуска
2
Язык
Русский
Страницы
42-49
Статус
Опубликовано
Год
2010
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
text; class; vector; metrics; centre of cluster; experiment; data clustering; heading; текст; кластеризация; класс; вектор; метрика; центр кластера; рубрика; эксперимент
Цитировать
Поделиться

Другие записи