Development of Relational Model of Data on the Inhabitants of the Russian Empire based on the Digitized Russian Census Documents

Brileva, N.Ye.; Pankratov, A.S.

Построение реляционной модели данных о жителях Российской империи по оцифрованным документам российских переписей

Описывается технология построения базы данных, содержащей материалы переписей населения Российской империи, на примере ревизских сказок XVIII-XIX веков. База данных строится на основе оцифровки архивных материалов переписей, сделанной в формате Excel. Описывается алгоритм распознавания смысловых конструкций записей в переписных документах, выделения атрибутов и правила заполнения реляционных таблиц. Алгоритм приводится для конкретных переписей (4 и 5 ревизий), однако подобные алгоритмы могут быть разработаны и для других ревизий, что позволит выстроить непрерывную цепочку исторических переписных ведомостей, переведенную в единый формат базы данных. Наличие такой цепочки может оказать существенную помощь в генеалогических исследованиях.

Development of Relational Model of Data on the Inhabitants of the Russian Empire based on the Digitized Russian Census Documents

A technique of a database constructing which contains materials of the Russian Empire censuses, by the example of census returns of XVIII-XIX centuries is considered. The database is based on the digitization of archival materials census made in Excel-format. An algorithm for recognition of semantic structures in the records of census documents, the detection of attributes and rules for ﬁlling the relational tables are described. The algorithm is given for the speciﬁc census (4 and 5 revisions), but these algorithms can be also developed for other revisions and it will make possible to build a continuous chain of historical census lists, translated into a single database format. Such a chain can provide meaningful assistance in genealogical research.

Скачать

Авторы

Брилёва Н.Е. (Brileva N.Ye.) ¹ , Панкратов А.С. (Pankratov A.S.) ¹

Журнал

Вестник Российского университета дружбы народов. Серия: Математика, информатика, физика (RUDN Journal of Mathematics, Information Sciences and Physics)

Издательство

Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)

Номер выпуска

Язык

Русский

Страницы

104-115

Статус

Опубликовано

Год

2012

Организации

¹ Российский университет дружбы народов

Ключевые слова

база данных; полуструктурируемые данные; оцифровка; генеалогия; перепись; ревизия; ревизская сказка; database; semistructured data; digitizing; genealogy; census; census return

Цитировать

ГОСТ MLA RIS BibTex

Другие записи

О ВЗАИМОДЕЙСТВИИ СПИНОРНОГО И СКАЛЯРНОГО ПОЛЕЙ, УСТРАНЯЮЩЕМ ВКЛАД СКАЛЯРНОГО ПОЛЯ В ГЕОМЕТРИЮ ПРОСТРАНСТВА-ВРЕМЕНИ

Статья

Вилка Чайча М.Б.

Вестник Российского университета дружбы народов. Серия: Математика, информатика, физика. 2012. С. 97-103

СОВРЕМЕННЫЙ УРОВЕНЬ И ТЕНДЕНЦИИ РАЗВИТИЯ СРЕДСТВ ОБЕСПЕЧЕНИЯ СЕТЕВОЙ БЕЗОПАСНОСТИ СИСТЕМ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ

Статья

Емельянова Ю.Г., Мбайкоджи Э., Соченков И.В.

Вестник Российского университета дружбы народов. Серия: Математика, информатика, физика. 2012. С. 116-126