Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 20–24 апреля 2015 г..
РУДН.
2015.
P. 134-136
В работе рассмотрена задача бинарной непересекающейся классификации данных, содержащих разнородные признаки. Проанализированы методы обработки категориальных признаков в задачах машинного обучения. В работе используется открытый набор данных Титаник[2], предоставленный в международном обучающем соревновании на kaggle [1].
This work covers binary classification problem for datasets with heterogeneous features. The aim is to analyze and compare different approach to handle with categorical features in binary classification problem. In this work used open dataset Titanic [2].