Поиск оригинальных публикаций по фундаментальной и клинической медицине наивысшего научного качества - насущная необходимость для каждого врача-исследователя. Такие публикации принципиально необходимы, в частности, для разработки надёжных стандартов лечения. Существенной подмогой в решении этой задачи являются англоязычные ресурсы PUBMED и EMBASE. Однако существует очевидная проблема оценки качества находимых исследований. В работе сформулирована методика анализа текстов биомедицинских публикаций, в основе которой лежит алгоритмическая оценка эмоциональной модальности медицинских текстов (т. н. сентимент-анализа). Применение топологической теории анализа данных позволило разработать комплекс высокоточных алгоритмов для выявления 16 типов сентиментов (манипулятивные обороты речи, исследования без положительных результатов, пропаганда, подделка результатов, негативное личное отношение, агрессивность текста, негативный эмоциональный фон и др.). На основе разработанных алгоритмов получена балльная шкала оценки сентимент-качества исследований, которую мы назвали «ß-баллом»: чем выше ß-балл, тем в меньшей степени оцениваемый текст содержит манипулятивные языковые конструкции. В результате разработана и апробирована система ANTIFAKE (http://antifake-news.ru), предназначенная для анализа сентимент-качества англоязычных научных текстов. Анализ ~20 млн абстрактов из PUBMED показал, что публикации с низким сентимент-качеством (β-балл<0, т. е. преобладание манипулятивных конструкций над содержательными) составляют всего 19 %. В подавляющем большинстве тематических рубрик (27 090 из 27 840 рубрик MESH-системы PUBMED) показана положительная динамика сентимент-качества текстов публикаций по годам. В то же время, в результате исследования были выделены 249 рубрик с резко отрицательной динамикой сентимент-качества и с выраженным нарастанием манипулятивных сентиментов, характерных для «жёлтой» англоязычной прессы. Данные рубрики включают десятки тысяч публикаций в реферируемых журналах, которые направлены на (1) легализацию этически порочных практик (эвтаназия, т. н. «контроль популяций» и т. п.), (2) дискредитацию психиатрии как науки, (3) медийную войну против микронутриентов и (4) дискредитацию доказательной медицины под видом разработки т. н. «международных стандартов доказательной медицины». В целом, разработанная система искусственного интеллекта позволяет отфильтровывать псевдонаучные публикации, текст которых перегружен эмоциональной манипуляцией и которые публикуются под маской «доказательных стандартов».
The search for original publications on fundamental and clinical medicine that would produce results of the highest scientific quality represents an urgent need for every medical researcher. Such publications are essential, in particular, for the development of reliable treatment standards. The English-language resources PUBMED and EMBASE are essential to help in solving this problem. However, there is an obvious problem in assessing the quality of the studies found. The paper formulates a method for analyzing the texts of biomedical publications, which is based on an algorithmic assessment of the emotional modality of medical texts (so-called sentiment analysis). The use of the topological theory of data analysis made it possible to develop a set of high-precision algorithms for identifying 16 types of sentiments (manipulative turns of speech, research without positive results, propaganda, falsification of results, negative personal attitude, aggressiveness of the text, negative emotional background, etc.). On the basis of the developed algorithms, a point scale for assessing the sentiment quality of research was obtained, which we called the "ß-score": the higher the ß-score, the less the evaluated text contains manipulative language constructions. As a result, the ANTIFAKE system (http://antifake-news.ru) was developed to analyze the sentiment-quality of English-language scientific texts. An analysis of ~ 20 million abstracts from PUBMED showed that publications with low sentiment quality (ß-score <0, that is, that the prevalence of manipulative constructions over meaningful ones) is only 19 %. In the overwhelming majority of thematic headings (27,090 out of 27,840 headings of the MESH system PUBMED), a positive dynamics of sentiment quality of the texts of publications is shown by years). At the same time, as a result of the study, 249 headings were identified with sharply negative dynamics of sentiment quality and with a pronounced increase in manipulative sentiments characteristic of the "yellow" English-language press. These headings include tens of thousands of publications in peer-reviewed journals, which are aimed at (1) legalizing ethically unacceptable practices (euthanasia, perversions, so-called "population control", etc.), (2) discrediting psychiatry as a science, (3) media the war against micronutrients and (4) discrediting evidence-based medicine under the guise of developing the so-called "international standards of evidence-based medicine". In general, the developed system of artificial intelligence allows researchers to filter out pseudoscientific publications, the text of which is overloaded with emotional manipulation and which are published under the guise of "evidence-based standards".