в настоящей работе авторы приводят описание методики статистического анализа текстов Telegram-каналов, основанной на сравнении методами корреляционного анализа автоматически сформированных частотных словарей. Рассматриваются коэффициенты попарной ранговой корреляции для сравнения частотных характеристик текстов различных неявных сообществ на естественном языке. Метод предлагается для оценки качества выделения неявных сообществ на графе, полученном при импорте данных из сети каналов мессенджера Telegram.
the study is a statistical analysis of Telegram channels based on the correlation analysis of automatically generated frequency dictionaries. We presented the pairwise correlation factors for comparing the word frequency distribution in informal community posts. The method can identify informal communities by analyzing a graph built on the data exported from the Telegram messenger.