Технологии интеллектуального анализа данных : учебное пособие

112 На каждом шаге алгоритма выбирается значение переменной, которое разделяет все множество на два подмножества. Разделение должно выполняться так, чтобы все объекты класса, для которого строится дерево, принадлежали одному подмножеству. Такое раз- биение производится до тех пор, пока не будет построено подмно- жество, содержащее только объекты одного класса. Для выбора независимой переменной и ее значения, которое разделяет множество, выполняются следующие действия: 1) из построенного на предыдущем этапе подмножества (для первого этапа это вся обучающая выборка), включающего объекты, относящиеся к выбранному классу для каждой независимой перемен- ной, выбираются все значения, встречающиеся в этом подмножестве; 2) для каждого значения каждой переменной подсчитывается количество объектов, удовлетворяющих этому условию и относя- щихся к выбранному классу; 3) выбираются условия, покрывающие наибольшее количест- во объектов выбранного класса; 4) выбранное условие является условием разбиения подмно- жества на два новых. После построения дерева для одного класса таким же обра- зом строятся деревья для других классов. Приведем пример для данных, представленных в табл. 3.3. Предположим, необходимо построить правило для определения условий, при которых необходимо рекомендовать жесткие линзы: Если (?) то рекомендация = жесткие Выполним оценку каждой независимой переменной и всех их возможных значений: возраст = юный – 2/8 ; возраст = пожилой – 1/8 ; возраст = старческий – 1/8 ;

RkJQdWJsaXNoZXIy MTY0OTYy