Корпусная лингвистика: теория vs методология

Проведено комплексное исследование этапов становления и развития корпусной лингвистики. Целью статьи является анализ научных подходов к вопросу научной значимости рассматриваемой лингвистической дисциплины, а также выявление комплекса понятий и критериев, составляющих фундамент данного направления. Корпусная лингвистика представляет собой одну из наиболее перспективных и быстро развивающихся областей языковых исследований. Лингвистика XIX века ставила своей целью изучение языка как такового, лингвистика XXI века видит актуальность исследования не в выявлении абсолютных лингвистических категорий и значений, но в практическом применении лингвистических знаний. Актуальность представляемой статьи определяется тем, что в лингвистических корпусах заложен огромный потенциал, который еще не в полной мере осмыслен научным сообществом, хотя бы в силу того, что текст - основной объект корпусной лингвистики - в различных формах своей реализации представляет собой одну из главных составляющих системы языка и речемыслительной деятельности современного носителя языка. Содержание и объем лингвистических корпусов различного рода позволяет получать достоверную информацию об актуальном и реальном использовании того или иного термина: корпус становится инструментом анализа функционирования этого термина как в лингвистической области (морфологии, синтаксиса и лексики), так и в теории и практике перевода, идентифицируя регистр его формального или неформального узуса. Принципиальная новизна результатов данного исследования позволяет говорить о правомерности создания корпусных словарей и корпусных грамматик нового поколения, разработанных и верифицированных по отношению к конкретному фиксированному корпусу. Одновременно обосновывается положение о том, что корпусный характер словарей и грамматик повышает их надежность, достоверность и объективность и позволяет избежать субъективности, которая нередко свойственна исследованиям, опирающимся исключительно на интуицию лингвиста. Корпус является средой для получения новых научных данных, осмысление которых представляется приоритетным для современного лингвистического описания и абсолютно необходимым в научной деятельности современного исследователя. Новизна проведенного анализа заключается в том, подтверждена целесообразность корпусных исследований как сущностное требование времени, связанное с новым качеством лингвистической реальности и отвечающее потребностям современного общества. В статье рассматриваются основные этапы становления корпусной лингвистики как научного направления, характеризуются научные представления и подходы, присущие каждому из этих этапов, представляется обзор основных понятийных положений корпусной лингвистики в рамках отечественного и зарубежного языкознания. Автор подробно анализирует полемику между представителями различных научных направлений и выявляет преимущества того или иного подхода, прослеживает сходства и различия между подходами к изучению корпусов на различных исторических этапах становления изучаемого научного направления. В фокусе обзора роль и место корпусных исследований языка в современной лингвистике, сопоставление аргументов pro и contra применения корпусных технологий в лингвистическом описании. Значительное внимание обращается на основные критерии классификации корпусов, предлагается краткий обзор наиболее известных в истории корпусов, а также обсуждаются перспективы их использования в различных областях современной науки о языке.

The article is devoted to a comprehensive study of the stages of formation and development of corpus linguistics. The purpose of the article is to analyze various scientific approaches to the scientific significance of this linguistic discipline and identify a set of concepts and criteria that form the foundation of this field. Corpus linguistics is one of the most promising and rapidly developing areas of language research. Linguistics of the XIX century set as its goal the study of language as such, and linguistics of the XXI century sees the relevance of the research not in identifying absolute linguistic categories and meanings but in the practical application of linguistic knowledge. The relevance of the article is determined by the fact that the linguistic corpus contains a vast potential, which the scientific community has not fully comprehended since the text as the main object of corpus linguistics in various forms of its implementation is one of the central components systems of language and speech-thinking activity of a modern native speaker of any language. The content and volume of linguistic corpora of various kinds allow obtaining reliable information about the modern and real use of a particular term: the corpus becomes a tool for analyzing the functioning of this term both in the linguistic field of morphology, syntax, and vocabulary and in the theory and practice of translation, identifying the register of its formal or informal usage. The fundamental novelty of this study's results allows us to speak about the legitimacy of the creation of corpus dictionaries and corpus grammars of a new generation, developed and verified concerning a specific fixed corpus. Simultaneously, the author substantiates the proposition that the corpus nature of dictionaries and grammars increases their reliability and objectivity and avoids the subjectivity that is often characteristic of research-based solely on the intuition of a linguist. The corpus is a medium for obtaining new scientific data, the comprehension of which seems to be a priority for modern linguistic description and necessary in the scientific activity of a modern researcher. From our point of view, this article's relevance and novelty lie in the fact that the expediency of corpus research is an essential requirement of the time, associated with a new quality of linguistic reality and meeting the needs of modern society. The article examines the main stages of the formation of corpus linguistics as a scientific field, characterizes the scientific concepts and approaches inherent in each of these stages, provides an overview of the main conceptual provisions of corpus linguistics within the framework of domestic and foreign linguistics. The author analyzes in detail the polemics between representatives of various scientific directions and reveals the advantages of one or another approach, traces the similarities and differences between approaches to the study of corpora at various historical stages of their formation. The review's focus is the role and place of corpus studies of language in modern linguistics, comparison of the pro and contra arguments of the use of corpus technologies in linguistic description. Considerable attention is paid to the main criteria for the classification of corpora, a brief overview of the most famous corpora in history is offered, and the prospects for their use in various fields of modern language science are discussed.

Издательство
Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)
Номер выпуска
1
Язык
Русский
Страницы
196-218
Статус
Опубликовано
Том
12
Год
2021
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
corpus linguistics; language corpus; methodology; representativeness; classification; criteria; корпусная лингвистика; языковой корпус; методология; репрезентативность; классификация; критерии
Цитировать
Поделиться

Другие записи

Канестри В.Г., Шахгильдян В.И., Кравченко А.В., Коннов Д.С., Попова А.А.
Jurnal Infektologii. Interregional public organization Association of infectious disease specialists of Saint-Petersburg and Leningrad region (IPO AIDSSPbR). Том 13. 2021. С. 21-28
Новоспасская Н.В., Авагян А.А.
Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). Том 12. 2021. С. 89-104