Выявление метастазов рака шейки матки с помощью машинного обучения

Цель исследования: Разработать метод диагностики метастатического поражения регионарных лимфатических узлов у больных раком шейки матки (РШМ) на основе определенных показателей крови методами машинного обучения. Машинное обучение - это эффективный способ классификации данных, особенно в области медицины, где он широко используется в диагностике. Материал и методы: 495 пациенток МНИОИ им. П. А. Герцена, филиала ФГБУ НМИЦ радиологии Минздрава России в возрасте 18-82 лет (42 лет), с верифицированным диагнозом РШМ были разделены на 2 группы: с метастазами в регионарных лимфатических узлах и без метастазов. Исследование полученных у каждой больной РШМ 21 показателей крови определило, что наиболее адекватно пациентки были визуально разделимы по следующим семи показателям: СОЭ, эритроциты, гемоглобин, фибриноген, Д-димер, агрегация тромбоцитов с АДФ и РФМК. Для проведения машинного обучения были выбраны следующие алгоритмы: Дерево решений (DT); Случайный лес (RF); К ближайшим соседям (KNN); методы опорных векторов (SVM); Adaboost и XGBoost. Результаты. Точность построенных моделей на обучающей и тестовой выборках (70 % и 30 %, соответственно) показала, что наиболее точными являются модели Adaboost (100 %, 98 %) и XGBoost (100 %, 98 %) (Рис 2). Оценка моделей по ROC-AUC показала, что XGBoost (100 %, 99,8 %) незначительно лучше, чем Adaboost (100 %, 98,8 %). Однако, R2 показала, что доля объясняющей дисперсии лучше у XGBoost (100 %, 80,5), чем у Adaboost (84,9 %, 66,1 %). Выводы. Экспериментальные результаты показывают, что «Метод опорных векторов» (SVM) и XGBoost обеспечивают высочайшую точность (98 %) при максимальной объясняющей доле дисперсии (82,9 % и 80,5 %, соответственно). «Метод опорных векторов» (SVM) является наиболее точным (98 %) с максимальной объясняющей способностью (82,9 %) для диагностики наличия или отсутствия метастазов РШМ в регионарных лимфатических узлах на основе показателей крови.

Objective of the study is to develop a method of diagnosis of regional lymph node metastasis in patients with cervical cancer (CC) based on certain hematological parameters using machine learning algorithms. Machine learning algorithm is an effective technique of data classification, particularly in medical field where it is extensively used for diagnostic purposes. Materials and methods. 495 patients of P. A. Gertsen Moscow Scientific Research Oncologic Institute - a Branch of Federal State Budgetary Institution “National Medical Research Center of Radiology” of the Ministry of Healthcare of the Russian Federation aged from 18 to 82 years (42 years) with verified diagnosis of cervical cancer were divided into 2 groups according to the presence or absence of regional lymph node metastasis: with metastases and without metastases. An examination of 21 parameters of blood samples collected from each patient with cervical cancer determined that the patients were most appropriately visually separable based on 7 components: ESR (erythrocyte sedimentation rate), erythrocytes, hemoglobin, fibrinogen, D-dimer, platelet aggregation with ADP (adenosine diphosphate) and SFMC (soluble fibrin monomer complex). The following algorithms were chosen to conduct machine learning: Decision Tree (DT), Random Forest (RF), K-nearest Neighbors (KNN), Support Vector Machine (SVM), Adaboost andXGBoost. Results. Accuracy of the models constructed on training and testing samples (70 % and 30 % respectively) highlighted that Adaboost (100 %, 98,8 %) and XGBoost (100 %, 99,8 %) models are the most accurate (Fig.2). The assessment of the models based on ROC-AUC showed that XGBoost (100 %, 99,8 %) is slightly better than Adaboost (100 %, 98,8 %). However, R2 revealed that XGBoost (100 %, 80,5 %) provides more accurate proportion of explained variance than Adaboost (84,9 %, 66,1 %). Conclusion. Experimental findings indicate that “Support Vector Machine” technique (SVM) ensures the highest grade of accuracy (98 %) with maximum proportion of explained variance (82,9 % and 80,5 %, respectively). “Support Vector Machine” is the most precise technique (98 %) with maximum explanatory power (82,9 %) for the diagnosis of the presence of cervical cancer metastases in regional lymph nodes based on hematological parameters.

Авторы
Сушинская Т.В. 1 , Кузнецов А.И. 2 , Щепкина Е.В.3 , Стуклов Н.И. 4 , Епифанова С.В.5
Номер выпуска
2
Язык
Русский
Страницы
71-84
Статус
Опубликовано
Год
2022
Организации
  • 1 МНИОИ им. П. А. Герцена - филиала ФГБУ «НМИЦ радиологии» Минздрава России
  • 2 Московский Авиационный Институт (МАИ)
  • 3 РТУ-МИРЭА
  • 4 РУДН
  • 5 ФГБУ «ЦКБ с поликлиникой УДП РФ»
Ключевые слова
cervical cancer; Cc; metastases; machine learning; algorithms; predictive modeling; diagnosis; рак шейки матки; РШМ; метастазы; машинное обучение; алгоритмы; модель прогнозирования; диагностика; accuracy; ROC-AUC; R<sup>2</sup>
Дата создания
28.12.2023
Дата изменения
28.12.2023
Постоянная ссылка
https://repository.rudn.ru/ru/records/article/record/95970/
Поделиться

Другие записи

КВАРАЦХЕЛИЯ А.Г., ЖАНЫБЕК КЫЗЫ К., КЛОЧКОВА С.В.
Вестник новых медицинских технологий. Электронное издание. Федеральное государственное бюджетное образовательное учреждение высшего образования Тульский государственный университет. Том 16. 2022. С. 78-82
Сорокина Т.М., Брагина Е.Е., Сорокина Е.А., Седова А.О., Штаут М.И., Курило Л.Ф., Черных В.Б.
Андрология и генитальная хирургия. Некоммерческое партнерство "Профессиональная Ассоциация Андрологов". Том 23. 2022. С. 72-84