Известно, что белок человека имеет уникальную аминокислотную последовательность в пределах генома, по которой его можно идентифицировать. Поэтому, имея количественный протеомный анализ некоторого участка в известном белке, можно определить, содержит ли искомый белок такую же уникальную последовательность. Такая задача до сих пор решается биоинформатиками вручную. В связи с этим, целью данной работы было поставлено автоматизирование процесса анализа биологического образца, который имеет некоторое количество различных белков. В качестве алгоритма предлагается построение модели классификации, на основе некоторого образца с результатами эксперта. Данная работа направлена на анализ протеомных или других био-медицинских данных в сферах биоинформатики и информационных технологий в медицине.
It is known that a human protein has a unique amino acid sequence within the genome, according to which it can be identified. Therefore, having a quantitative proteomic analysis of the region in known protein, it can be determined whether the desired protein contains the same unique sequence. This problem is still solved by bioinformatics manually. In this case, the purpose of this work is to automate the process of analyzing a biological sample that has a number of different proteins. The algorithm is proposed to construct a classification model, based on a sample with the results of an expert. This work is aimed at the analysis of proteomic or other bio-medical data in the fields of bioinformatics and information technology in medicine.