Тематическое моделирование корпуса документов с применением LDA

В данной работе рассматривается создание автоматизированной системы тематического моделирования, основанной на данных одного из цифровых архивов научных публикаций в сфере компьютерной лингвистики и NLP ACL Anthology, а также выявление и визуализация ключевых тематик на основе всего корпуса представленных документов.

Topic modeling with Latent Dirichlet Allocation

This paper discusses the creation of an automated topic modeling system based on data from one of the digital archives of scientific publications in the field of computational linguistics and NLP ACL Anthology, as well as the identification and visualization of key topics based on the entire corpus of submitted documents.

Authors
Publisher
Российский университет дружбы народов (РУДН)
Language
Russian
Pages
254-259
Status
Published
Year
2022
Organizations
  • 1 Peoples' Friendship University of Russia
Keywords
nlp; lda; computer Science; text processing; topic modelling; компьютерные науки; обработка текста; тематическое моделирование
Date of creation
06.07.2022
Date of change
06.07.2022
Short link
https://repository.rudn.ru/en/records/article/record/86043/
Share

Other records

Shvets S.S.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. Российский университет дружбы народов (РУДН). 2022. P. 286-289