Составление словарей лингвистических показателей текстов методами корпусного анализа

В данной работе рассмотрены методы корпусной лингвистики в их практическом применении к частотному словарю. Частотные словари были созданы на основе корпуса русских рассказов начала 20 века и проанализированы с помощью методов корпусной лингвистики, предоставляемых платформой TXM. Также был сделан вывод, что с помощью частотных словарей можно отслеживать изменения, происходящие во времени в естественных языках. Данная работа состоит из таких частей, как введение, теоретическая часть, практическая часть и заключение. В теоретической части представлена информация по темам корпусной лингвистики, корпусам и их типам, а также частотным словарям и методу частотного анализа. Практическая часть содержит информацию о составлении частотного словаря и его анализе методами платформы TXM. В конце работы подводятся итоги.

Compiling word lists of texts' linguistic indicators by the means of corpus analysis methods

In this paper the methods of corpus linguistics in their practical application to the word list were considered. The word lists were created based on the corpus of Russian stories of the early 20th century and analyzed by the means of the corpus linguistics methods provided by the TXM platform. It was also concluded that with the help of word lists it is possible to track the changes occurring over time in natural languages. This paper consists of such parts as introduction, theoretical part, practical part and conclusion. In the theoretical part, the information about the topics of corpus linguistics, corpora and their types, as well as word lists and the method of frequency analysis is provided. The practical part contains the information about the compilation of a word list and its analysis by the means of the TXM platform methods. At the end of the work, the summarized results are given.

Authors
Publisher
Российский университет дружбы народов (РУДН)
Language
Russian
Pages
386-391
Status
Published
Year
2023
Organizations
  • 1 Peoples' Friendship University of Russia
Keywords
corpus linguistics; word lists; TXM platform; корпусная лингвистика; частотные словари; платформа TXM
Date of creation
28.12.2023
Date of change
28.12.2023
Short link
https://repository.rudn.ru/en/records/article/record/102172/
Share

Other records

Podoroga V.A.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. Российский университет дружбы народов (РУДН). 2023. P. 382-385
Polienko A.N.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. Российский университет дружбы народов (РУДН). 2023. P. 392-394