Построение реляционной модели данных о жителях Российской империи по оцифрованным документам российских переписей

Описывается технология построения базы данных, содержащей материалы переписей населения Российской империи, на примере ревизских сказок XVIII-XIX веков. База данных строится на основе оцифровки архивных материалов переписей, сделанной в формате Excel. Описывается алгоритм распознавания смысловых конструкций записей в переписных документах, выделения атрибутов и правила заполнения реляционных таблиц. Алгоритм приводится для конкретных переписей (4 и 5 ревизий), однако подобные алгоритмы могут быть разработаны и для других ревизий, что позволит выстроить непрерывную цепочку исторических переписных ведомостей, переведенную в единый формат базы данных. Наличие такой цепочки может оказать существенную помощь в генеалогических исследованиях.

Development of Relational Model of Data on the Inhabitants of the Russian Empire based on the Digitized Russian Census Documents

A technique of a database constructing which contains materials of the Russian Empire censuses, by the example of census returns of XVIII-XIX centuries is considered. The database is based on the digitization of archival materials census made in Excel-format. An algorithm for recognition of semantic structures in the records of census documents, the detection of attributes and rules for filling the relational tables are described. The algorithm is given for the specific census (4 and 5 revisions), but these algorithms can be also developed for other revisions and it will make possible to build a continuous chain of historical census lists, translated into a single database format. Such a chain can provide meaningful assistance in genealogical research.

Авторы
Брилёва Н.Е.1 , Панкратов А.С. 1
Издательство
Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)
Номер выпуска
2
Язык
Русский
Страницы
104-115
Статус
Опубликовано
Год
2012
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
база данных; полуструктурируемые данные; оцифровка; генеалогия; перепись; ревизия; ревизская сказка; database; semistructured data; digitizing; genealogy; census; census return
Дата создания
04.12.2019
Дата изменения
04.12.2019
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/54615/
Поделиться

Другие записи

Вилка Чайча М.Б.
Вестник Российского университета дружбы народов. Серия: Математика, информатика, физика. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). 2012. С. 97-103
Емельянова Ю.Г., Мбайкоджи Э., Соченков И.В.
Вестник Российского университета дружбы народов. Серия: Математика, информатика, физика. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). 2012. С. 116-126