Methods of extracting biomedical information from patents and scientific publications (on the example of chemical compounds)

Kolpakov, Nikolay A.; Molodchenkov, Alexey I.; Lukin, Anton V.

Методы извлечения биомедицинских текстов из патентов и научных публикаций (на примере химических соединений)

В данной статье предложен алгоритм для решения задачи извлечения информации из биомедицинских патентов и научных публикаций. Представленный алгоритм основан на методах машинного обучения. Авторами были проведены эксперименты на патентах из базы USPTO. Эксперименты показали, что лучшее качество извлечения продемонстрировала модель, построенная на основе BioBERT.

Methods of extracting biomedical information from patents and scientific publications (on the example of chemical compounds)

This article proposes an algorithm for solving the problem of extracting information from biomedical patents and scientific publications. The introduced algorithm is based on machine learning methods. Experiments were carried out on patents from the USPTO database. Experiments have shown that the best extraction quality was achieved by a model based on BioBERT.

Скачать

Авторы

Колпаков Н.А. (Kolpakov Nikolay A.) ² , Молодченков А.И. (Molodchenkov Alexey I.) ^1, ³ , Лукин А.В. (Lukin Anton V.) ^1, ³

Журнал

Discrete and Continuous Models and Applied Computational Science

Издательство

Федеральное государственное автономное образовательное учреждение высшего образования Российский университет дружбы народов (РУДН)

Номер выпуска

Язык

Английский

Страницы

64-74

Статус

Опубликовано

Ссылка

Внешняя ссылка

DOI

10.22363/2658-4670-2023-31-1-64-74

Том

Год

2023

Организации

¹ Российский университет дружбы народов
² Московский физико-технический институт
³ Федеральный исследовательский центр «Информатика и управление» РАН

Ключевые слова

machine learning; natural language processing; named entity recognition; biomedical texts processing; машинное обучение; обработка естественного языка; извлечение именованных сущностей; обработка биомедицинских текстов

Цитировать

ГОСТ MLA RIS BibTex

Другие записи

ПРИЧИННО-СЛЕДСТВЕННАЯ СВЯЗЬ МЕЖДУ ПРЯМЫМИ ИНОСТРАННЫМИ ИНВЕСТИЦИЯМИ И ЭКОНОМИЧЕСКИМ РОСТОМ В РАЗВИВАЮЩИХСЯ СТРАНАХ: РОССИЙСКИЙ ОПЫТ

Статья

Бру К.А., Смирнов И.В.

Discrete and Continuous Models and Applied Computational Science. Том 31. 2023. С. 46-63

ИЗУЧЕНИЕ МЕХАНИЗМА ЭЛЕКТРИЧЕСКОГО ВЗРЫВА МЕТАЛЛИЧЕСКИХ ПРОВОДНИКОВ

Статья

Кравченко Н.Ю., Ковтунов С.С.

Discrete and Continuous Models and Applied Computational Science. Том 31. 2023. С. 75-86