В настоящее время в маркетинговых исследованиях при мониторинге фармацевтического рынка стоит задача сопоставления наименований аптечных препаратов заданному справочнику идентификаторов торговой позиции, так называемых SKU. Проблема такого сопоставления заключается в том, что, во-первых, не существует единого справочника или единой системы, в которой каждый препарат имеет свой уникальный SKU, а также в том, что каждая аптека или аптечная сеть может по-разному называть один и тот же аптечный препарат, в названиях могут присутствовать ошибки и использоваться различные сокращения. В статье описывается подход к решению данной задачи с использованием методов машинного обучения.
Nowadays marketing research in monitoring the pharmaceutical market has a goal focused on comparison the names of pharmaceutical drugs to a given reference dictionary of identifiers of a trading positions, the so-called SKUs. The problem with this comparison is that, firstly, there is no single reference dictionary or a single system in which each drug has its own unique SKU, also each pharmacy or pharmacy chain can differently name the same pharmacy drugs, errors may be present in the names and various abbreviations may be used. The article describes the approach to solving this problem using machine learning methods.