ФОРМИРОВАНИЕ МЕТАДАННЫХ МНОГОМЕРНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ НА БАЗЕ КЛАССИФИКАЦИОННЫХ СХЕМ

Разработан способ формирования метаданных многомерной информационной системы путем сопряжения классификационных схем. Каждая классификационная схема представляет собой иерархию значений измерений, относящихся к отдельной структурной компоненте наблюдаемого явления. В основе метода лежит выявление групп значений измерений, которые связаны с группами значений других измерений. Группы значений разных измерений используются для построения кластеров сочетаний значений измерений. Сочетания кластера формируются декартовым произведением групп значений измерений. Метаданные информационной системы представлены в виде множества допустимых сочетаний значений измерений, которые формируются как набор кластеров. Для решения этой сложной задачи наблюдаемое явление рассматривается как набор структурных компонент. Из полного набора измерений информационной системы выделяются отдельные наборы измерений, семантически связанные со структурными компонентами наблюдаемого явления. Семантические связи, выявленные в процессе анализа структурной компоненты, позволяют построить иерархию групп значений измерений и представить их совокупность в виде графа - классификационной схемы, связанной со структурной компонентой. В информационных системах с многоаспектным описанием предметной области кубы данных характеризуются большой разреженностью, что затрудняет формирование метаданных. Классификационные схемы описывают отдельные аспекты метаданных, связанные с отдельными структурными компонентами наблюдаемого явления. Сопряжение классификационных схем дает возможность получить полное описание метаданных. Использование классификационных схем позволяет разбить задачу описания структуры аналитического пространства многомерной информационной системы на более простые задачи анализа его отдельных структурных компонент. Сопряжение классификационных схем, относящихся к разным структурным компонентам, дает возможность сформировать метаданные информационной системы. В метаданных центральное место занимает множество допустимых сочетаний значений измерений.

CLASSIFICATION SCHEME-BASED GENERATION OF MULTIDIMENSIONAL INFORMATION SYSTEM METADATA

The purpose of the paper is development of a method for generating metadata of a multidimensional information system by classification scheme conjugation. Each classification scheme is a hierarchy of dimension values (members) related to a separate structural component of the observed phenomenon. The method is based on the identification of groups of dimension values that are associated with the groups of values of other dimensions. The groups of members for different dimensions are used to generate clusters of member combinations. Cluster combinations are generated by the Cartesian product of groups of members. The metadata of the information system are presented as a set of possible member combinations, which is formed as a set of clusters. To solve this complex problem the observed phenomenon is considered as a set of structural components. Separate sets of dimensions, which are semantically related to the structural components of the observed phenomenon, are distinguished from the complete set of dimensions of the information system. The semantic relationships identified in the analysis of the structural component allow to generate a hierarchy of groups of dimension values and represent all of them in the form of a graph - a classification scheme associated with the structural component. In information systems with a multidimensional representation of a subject domain, data cubes are characterized by high sparseness, which complicates metadata generation. The classification schemes describe specific aspects of the metadata associated with the individual structural components of the observed phenomenon. Conjugation of the classification schemes allows to obtain a complete description of the metadata. The use of classification schemes provides the opportunity to divide the task of describing the structure of the multidimensional information system analytical space into simpler tasks of analysis of its individual structural components. The conjugation of classification schemes related to different structural components enables the generation of information system metadata. The central place in the metadata belongs to the set of possible member combinations.

Редакторы
-
Издательство
Федеральное государственное бюджетное образовательное учреждение высшего образования "Иркутский национальный исследовательский технический университет"
Номер выпуска
12
Язык
Русский
Страницы
145-156
Статус
Опубликовано
Подразделение
-
Ссылка
-
Номер
-
Том
22
Год
2018
Организации
  • 1 Российский университет дружбы народов
  • 2 Лаборатория новых информационных технологий
Ключевые слова
Multidimensional information system; multidimensional data cube; sparse data cube; classification scheme; combination of measurement values; set of possible member combinations
Дата создания
07.11.2019
Дата изменения
07.11.2019
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/51129/