Компьютерный анализ эмоциональной модальности 20 млн публикаций в базе данных PUBMED указывает на пути повышения эффективности фармакотерапии посредством идентификации псевдонаучных публикаций, направленных на негативную эмоциональную "накачку" врачей

Поиск оригинальных публикаций по фундаментальной и клинической медицине наивысшего научного качества - насущная необходимость для каждого врача-исследователя. Такие публикации принципиально необходимы, в частности, для разработки надёжных стандартов лечения. Существенной подмогой в решении этой задачи являются англоязычные ресурсы PUBMED и EMBASE. Однако существует очевидная проблема оценки качества находимых исследований. В работе сформулирована методика анализа текстов биомедицинских публикаций, в основе которой лежит алгоритмическая оценка эмоциональной модальности медицинских текстов (т. н. сентимент-анализа). Применение топологической теории анализа данных позволило разработать комплекс высокоточных алгоритмов для выявления 16 типов сентиментов (манипулятивные обороты речи, исследования без положительных результатов, пропаганда, подделка результатов, негативное личное отношение, агрессивность текста, негативный эмоциональный фон и др.). На основе разработанных алгоритмов получена балльная шкала оценки сентимент-качества исследований, которую мы назвали «ß-баллом»: чем выше ß-балл, тем в меньшей степени оцениваемый текст содержит манипулятивные языковые конструкции. В результате разработана и апробирована система ANTIFAKE (http://antifake-news.ru), предназначенная для анализа сентимент-качества англоязычных научных текстов. Анализ ~20 млн абстрактов из PUBMED показал, что публикации с низким сентимент-качеством (β-балл<0, т. е. преобладание манипулятивных конструкций над содержательными) составляют всего 19 %. В подавляющем большинстве тематических рубрик (27 090 из 27 840 рубрик MESH-системы PUBMED) показана положительная динамика сентимент-качества текстов публикаций по годам. В то же время, в результате исследования были выделены 249 рубрик с резко отрицательной динамикой сентимент-качества и с выраженным нарастанием манипулятивных сентиментов, характерных для «жёлтой» англоязычной прессы. Данные рубрики включают десятки тысяч публикаций в реферируемых журналах, которые направлены на (1) легализацию этически порочных практик (эвтаназия, т. н. «контроль популяций» и т. п.), (2) дискредитацию психиатрии как науки, (3) медийную войну против микронутриентов и (4) дискредитацию доказательной медицины под видом разработки т. н. «международных стандартов доказательной медицины». В целом, разработанная система искусственного интеллекта позволяет отфильтровывать псевдонаучные публикации, текст которых перегружен эмоциональной манипуляцией и которые публикуются под маской «доказательных стандартов».

The search for original publications on fundamental and clinical medicine that would produce results of the highest scientific quality represents an urgent need for every medical researcher. Such publications are essential, in particular, for the development of reliable treatment standards. The English-language resources PUBMED and EMBASE are essential to help in solving this problem. However, there is an obvious problem in assessing the quality of the studies found. The paper formulates a method for analyzing the texts of biomedical publications, which is based on an algorithmic assessment of the emotional modality of medical texts (so-called sentiment analysis). The use of the topological theory of data analysis made it possible to develop a set of high-precision algorithms for identifying 16 types of sentiments (manipulative turns of speech, research without positive results, propaganda, falsification of results, negative personal attitude, aggressiveness of the text, negative emotional background, etc.). On the basis of the developed algorithms, a point scale for assessing the sentiment quality of research was obtained, which we called the "ß-score": the higher the ß-score, the less the evaluated text contains manipulative language constructions. As a result, the ANTIFAKE system (http://antifake-news.ru) was developed to analyze the sentiment-quality of English-language scientific texts. An analysis of ~ 20 million abstracts from PUBMED showed that publications with low sentiment quality (ß-score <0, that is, that the prevalence of manipulative constructions over meaningful ones) is only 19 %. In the overwhelming majority of thematic headings (27,090 out of 27,840 headings of the MESH system PUBMED), a positive dynamics of sentiment quality of the texts of publications is shown by years). At the same time, as a result of the study, 249 headings were identified with sharply negative dynamics of sentiment quality and with a pronounced increase in manipulative sentiments characteristic of the "yellow" English-language press. These headings include tens of thousands of publications in peer-reviewed journals, which are aimed at (1) legalizing ethically unacceptable practices (euthanasia, perversions, so-called "population control", etc.), (2) discrediting psychiatry as a science, (3) media the war against micronutrients and (4) discrediting evidence-based medicine under the guise of developing the so-called "international standards of evidence-based medicine". In general, the developed system of artificial intelligence allows researchers to filter out pseudoscientific publications, the text of which is overloaded with emotional manipulation and which are published under the guise of "evidence-based standards".

Авторы
Максимов В.А. 1 , Торшин И.Ю. 2, 3 , Громова О.А. 2, 3 , Галустян А.Н. 4 , Гоголева И.В. 5 , Гришина Т.Р. 5 , Громов А.Н. 2, 3 , Калачева А.Г. 5 , Кобалава Ж.Д. 6 , Коденцова В.М.7 , Лиманова О.А. 5 , Малявская С.И. 8 , Рудаков К.В.2, 9 , Сардарян И.С.4 , Сорокин А.И.2, 3 , Стаховская Л.В. 10 , Тапильская Н.И. 11 , Тетруашвили Н.К.12 , Федотова Л.Э.5 , Хаджидис А.К.4
Издательство
ООО "Издательство ОКИ"
Номер выпуска
4
Язык
Русский
Страницы
19-40
Статус
Опубликовано
Год
2020
Организации
  • 1 ФГБОУ ДПО «Российская медицинская академия непрерывного профессионального образования» Министерства здравоохранения Российской Федерации
  • 2 ФГУ «Федеральный исследовательский центр «Информатика и управление» Российской академии наук»
  • 3 Центр хранения и анализа больших данных ФГБОУ ВО «Московский государственный университет им. М.В. Ломоносова»
  • 4 ФГБОУ ВО «Санкт-Петербургский государственный педиатрический медицинский университет» Министерства здравоохранения Российской Федерации
  • 5 ФГБОУ ВО «Ивановская государственная медицинская академия» Министерства здравоохранения Российской Федерации
  • 6 ФГАОУ ВО «Российский университет дружбы народов» (Медицинский институт)
  • 7 ФГБУН «Федеральный исследовательский центр питания, биотехнологии и безопасности пищи»
  • 8 ФГБОУ ВО «Северный государственный медицинский университет» Министерства здравоохранения Российской Федерации
  • 9 ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)»
  • 10 ФГБУ «Федеральный центр цереброваскулярной патологии и инсульта» Министерства здравоохранения Российской Федерации
  • 11 ФГБНУ «Научно-исследовательский институт акушерства, гинекологии и репродуктологии имени Д.О. Отта»
  • 12 ФГБУ «Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени академика В.И. Кулакова» Министерства Здравоохранения Российской Федерации
Ключевые слова
Pharmacoinformatics; evidence-based medicine; data mining; algorithms for evaluating the quality of publications; фармакоинформатика; доказательная медицина; интеллектуальный анализ данных; алгоритмы оценки качества публикаций
Цитировать
Поделиться

Другие записи

Иванов А.В., Пустовалов И.А., Пономарев А.Н.
Пожарная и аварийная безопасность. Федеральное государственное бюджетное образовательное учреждение высшего образования «Ивановская пожарно-спасательная академия Государственной противопожарной службы Министерства Российской Федерации по делам гражданской обороны, чрезвычайным ситуациям и ликвидации последствий стихийных бедствий». 2020. С. 39-41