Построение реляционной модели данных о жителях Российской империи по оцифрованным документам российских переписей

Описывается технология построения базы данных, содержащей материалы переписей населения Российской империи, на примере ревизских сказок XVIII-XIX веков. База данных строится на основе оцифровки архивных материалов переписей, сделанной в формате Excel. Описывается алгоритм распознавания смысловых конструкций записей в переписных документах, выделения атрибутов и правила заполнения реляционных таблиц. Алгоритм приводится для конкретных переписей (4 и 5 ревизий), однако подобные алгоритмы могут быть разработаны и для других ревизий, что позволит выстроить непрерывную цепочку исторических переписных ведомостей, переведенную в единый формат базы данных. Наличие такой цепочки может оказать существенную помощь в генеалогических исследованиях.

Development of Relational Model of Data on the Inhabitants of the Russian Empire based on the Digitized Russian Census Documents

A technique of a database constructing which contains materials of the Russian Empire censuses, by the example of census returns of XVIII-XIX centuries is considered. The database is based on the digitization of archival materials census made in Excel-format. An algorithm for recognition of semantic structures in the records of census documents, the detection of attributes and rules for filling the relational tables are described. The algorithm is given for the specific census (4 and 5 revisions), but these algorithms can be also developed for other revisions and it will make possible to build a continuous chain of historical census lists, translated into a single database format. Such a chain can provide meaningful assistance in genealogical research.

Authors
Brileva N.Ye.1 , Pankratov A.S. 1
Publisher
Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)
Number of issue
2
Language
Russian
Pages
104-115
Status
Published
Year
2012
Organizations
  • 1 Peoples’ Friendship University of Russia
Keywords
база данных; полуструктурируемые данные; оцифровка; генеалогия; перепись; ревизия; ревизская сказка; database; semistructured data; digitizing; genealogy; census; census return
Date of creation
04.12.2019
Date of change
04.12.2019
Short link
https://repository.rudn.ru/en/records/article/record/54615/
Share

Other records

Emelyanova J.G., Mbaykodzhi E., Sochencov I.V.
RUDN Journal of Mathematics, Information Sciences and Physics. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). 2012. P. 116-126