Методы извлечения биомедицинских текстов из патентов и научных публикаций (на примере химических соединений)

В данной статье предложен алгоритм для решения задачи извлечения информации из биомедицинских патентов и научных публикаций. Представленный алгоритм основан на методах машинного обучения. Авторами были проведены эксперименты на патентах из базы USPTO. Эксперименты показали, что лучшее качество извлечения продемонстрировала модель, построенная на основе BioBERT.

Methods of extracting biomedical information from patents and scientific publications (on the example of chemical compounds)

This article proposes an algorithm for solving the problem of extracting information from biomedical patents and scientific publications. The introduced algorithm is based on machine learning methods. Experiments were carried out on patents from the USPTO database. Experiments have shown that the best extraction quality was achieved by a model based on BioBERT.

Authors
Kolpakov Nikolay A.2 , Molodchenkov Alexey I. 1, 3 , Lukin Anton V. 1, 3
Publisher
Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)
Number of issue
1
Language
English
Pages
64-74
Status
Published
Volume
31
Year
2023
Organizations
  • 1 Peoples’ Friendship University of Russia
  • 2 Moscow Institute of Physics and Technology (MIPT)
  • 3 Federal research center “Computer science and control” of RAS
Keywords
machine learning; natural language processing; named entity recognition; biomedical texts processing; машинное обучение; обработка естественного языка; извлечение именованных сущностей; обработка биомедицинских текстов
Date of creation
07.07.2023
Date of change
10.07.2023
Short link
https://repository.rudn.ru/en/records/article/record/93611/
Share

Other records

Brou Kouame A., Smirnov Ivan V.
Discrete and Continuous Models and Applied Computational Science. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). Vol. 31. 2023. P. 46-63
Kravchenko Nikolay Yu., Kovtunov Sergey S.
Discrete and Continuous Models and Applied Computational Science. Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН). Vol. 31. 2023. P. 75-86