Тематическое моделирование корпуса документов с применением LDA

В данной работе рассматривается создание автоматизированной системы тематического моделирования, основанной на данных одного из цифровых архивов научных публикаций в сфере компьютерной лингвистики и NLP ACL Anthology, а также выявление и визуализация ключевых тематик на основе всего корпуса представленных документов.

Topic modeling with Latent Dirichlet Allocation

This paper discusses the creation of an automated topic modeling system based on data from one of the digital archives of scientific publications in the field of computational linguistics and NLP ACL Anthology, as well as the identification and visualization of key topics based on the entire corpus of submitted documents.

Авторы
Издательство
Российский университет дружбы народов (РУДН)
Язык
Русский
Страницы
254-259
Статус
Опубликовано
Год
2022
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
nlp; lda; computer Science; text processing; topic modelling; компьютерные науки; обработка текста; тематическое моделирование
Дата создания
06.07.2022
Дата изменения
06.07.2022
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/86043/
Поделиться

Другие записи

Швец С.С.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. Российский университет дружбы народов (РУДН). 2022. С. 286-289