Технологии интеллектуального анализа данных : учебное пособие

110 Легко убедиться, что: 1 | | (| | ) 1 m i i T T U     . Данный подход можно сформулировать следующим образом: предполагается, что пропущенные значения по переменной вероят- ностно распределены пропорционально частоте появления сущест- вующих значений. Алгоритм покрытия. Рассмотренные ранее методы построе- ния деревьев решений работают сверху вниз, разбивая на каждом шаге всю обучающую выборку на подмножества. Целью такого разбиения является получение подмножеств, соответствующих всем классам. Альтернативой подходу «разделяй и властвуй» является под- ход, который заключается в построении деревьев решений для ка- ждого класса по отдельности. Он называется алгоритмом покры- тия, так как на каждом этапе генерируется проверка узла дерева, который покрывает несколько объектов обучающей выборки. Идею алгоритма можно представить графически (рис. 3.4). Рис. 3.4. Геометрическая интерпретация идеи алгоритма покрытия Х 2 d c a b Х 1 Х 1 < b Х 1 >= b Х 1 >= a Х 2 >= c Х 2 >= d Х 1 < a Х 2 < c Х 2 < d

RkJQdWJsaXNoZXIy MTY0OTYy