В настоящей статье рассматривается задача построения системы проведения метаанализа данных выделенных из медицинских публикаций для получения ответа на клинический вопрос. Для проведения мета-анализа необходимо большое количество гомогенных данных, выделяемых из медицинских статей. Процесс выделения данных начинается с разметки экспертами небольшого числа статей с целью выделения структуры значимых медицинских данных. Затем опираясь на выделенную структуру составляется модель извлечения данных, содержащая в себе набор ключевых слов, правила отбора данных, синонимические словари. На основе эффективной модели извлечения данных из основного корпуса релевантных публикаций могут быть выделены данные в количестве необходимом для проведения мета-анализа.
In this article, we consider the task of constructing a system for conducting a meta-analysis of data extracted from medical publications to obtain a response to a clinical question. To conduct a meta-analysis, a large amount of homogeneous data is required from medical articles. The process of data extraction begins with the marking by experts of a small number of articles in order to highlight the structure of significant medical data. Then, based on the selected structure, a data extraction model is compiled, containing a set of keywords, data selection rules, and synonymous dictionaries. Based on an effective model of extracting data from the main body of relevant publications, data can be extracted in the amount necessary for conducting a meta-analysis.