Фразеологический массив и универсальное содержание фразеологических зон словарных статей «Большого универсального словаря русского языка», где многократно предложены фразеологические единицы в зависимости от грамматически опорного компонента соответственно алфавитному расположению заголовочного слова, представляют интерес в аспекте формирования исследовательского корпуса для создания словника электронного фразеологического словаря русского языка (АСПОТ). Цель исследования - определить показатели репрезентативности фразеологических зон в структуре толкового словаря и представить фразеостатистические модели частотного соотношения заголовочных слов как структурно-семантического компонента фразеологических единиц в алфавитном ряду. Материалом исследования стали 2545 фразеологических зон, которые сгруппированы в соответствии с буквами русского алфавита. В рамках корпусного подхода использовалась комбинация лингвостатистического метода, выборочного метода в эмпирическом исследовании, методов статистического моделирования. Научная новизна работы определяется концептуальным подходом к БУС - толковому словарю в бумажном формате - как лексикографическому корпусу в исследовании употребительности (частотности) фразеологических зон в словарных статьях. Параметрами репрезентативности фразеологических зон определены генеральная лингвистическая совокупность и выборочная лингвистическая совокупность как рабочий корпус. Фразеостатистические модели сгруппированы в соответствии с областью определения - совокупностью всех заголовочных слов, зафиксированной одной буквой русского алфавита. Рассмотрение фразеологических зон направлено на детальную проработку их количественной характеристики и процентного соотношения параметров статистической выборки. Приведена технология исследования и формула расчета показателей фразеостатистического моделирования. Результаты исследования иллюстрируются диаграммами и определяют объективность формирования исследовательского корпуса, его ядерных и периферийных пространств. Эти факторы станут определяющими для моделирования словника пилотного корпуса электронного словаря, направленного на смысловую реализацию фразеологических единиц.
The phraseological array and the universal content of the phraseological zones of dictionary entries in “The Great Universal Dictionary of the Russian Language”, wherein phraseological units are repeatedly presented depending on the grammatically supporting component according to the alphabetical arrangement of a heading word, are of interest in the aspect of a research corpus for creating a vocabulary of an online Russian phraseological dictionary (VORPD). The purpose of the study is to determine the indicators of the representativeness of phraseological zones in the structure of the explanatory dictionary and present phrase-statistical models of the frequency ratio of heading words as a structural-semantic component of phraseological units in alphabetical order. The materials of the research make 2545 phraseological zones grouped according to the letters of the Russian alphabet. Combinations of the linguo-statistical method, the sampling method in the empirical study, and the methods of statistical modelling were used as a part of the research corpus. The scientific novelty of the research is determined by the conceptual approach to the “The Great Universal Dictionary of the Russian Language” - an explanatory paper dictionary - as a lexicographic corpus in the study of the usage (frequency) of phraseological zones in dictionary entries. The parameters of the representativeness of phraseological zones define the general linguistic set and the selective linguistic set as a working corpus. Phrase-statistical models are grouped according to the domain of definition - the set of all heading words fixed by one letter of the Russian alphabet. A consideration of phraseological zones is aimed at a detailed study of their quantitative characteristics and the percentage ratio of statistical sampling parameters. The technology of the study and the formula for calculating the indicators of phrase-statistical modelling are given. The results of the study are illustrated by diagrams and determine the objectivity of the research corpus, its nuclear and peripheral spaces. These factors will be a determinant for modelling the vocabulary of the pilot corpus of the electronic dictionary aimed at the semantic realization of phraseological units.