Построение реляционной модели данных о жителях Российской империи по оцифрованным документам российских переписей

Описывается технология построения базы данных, содержащей материалы переписей населения Российской империи, на примере ревизских сказок XVIII-XIX веков. База данных строится на основе оцифровки архивных материалов переписей, сделанной в формате Excel. Описывается алгоритм распознавания смысловых конструкций записей в переписных документах, выделения атрибутов и правила заполнения реляционных таблиц. Алгоритм приводится для конкретных переписей (4 и 5 ревизий), однако подобные алгоритмы могут быть разработаны и для других ревизий, что позволит выстроить непрерывную цепочку исторических переписных ведомостей, переведенную в единый формат базы данных. Наличие такой цепочки может оказать существенную помощь в генеалогических исследованиях.

Development of Relational Model of Data on the Inhabitants of the Russian Empire based on the Digitized Russian Census Documents

A technique of a database constructing which contains materials of the Russian Empire censuses, by the example of census returns of XVIII-XIX centuries is considered. The database is based on the digitization of archival materials census made in Excel-format. An algorithm for recognition of semantic structures in the records of census documents, the detection of attributes and rules for filling the relational tables are described. The algorithm is given for the specific census (4 and 5 revisions), but these algorithms can be also developed for other revisions and it will make possible to build a continuous chain of historical census lists, translated into a single database format. Such a chain can provide meaningful assistance in genealogical research.

Authors
Брилёва Н.Е. (Brileva N.Ye.) 1 , Панкратов А.С. (Pankratov A.S.) 1
Publisher
Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)
Issue number
2
Language
Russian
Pages
104-115
State
Published
Year
2012
Organizations
  • 1 Peoples’ Friendship University of Russia
Keywords
база данных; полуструктурируемые данные; оцифровка; генеалогия; перепись; ревизия; ревизская сказка; database; semistructured data; digitizing; genealogy; census; census return
Share

Other records