Технологии интеллектуального анализа данных : учебное пособие

93 торое классифицирует объекты из обучающей выборки. При этом в заключительной части правила указывается значение зависимой переменной, которое наиболее часто встречается у объектов с вы- бранным значением независимой переменной. В этом случае ошибкой правила является количество объектов, имеющих то же значение рассматриваемой переменной, но не относящихся к вы- бранному классу. Таким образом, для каждой переменной будет получен набор правил (для каждого значения). Оценив степень ошибки каждого набора, выбирают переменную, для которой построены правила с наименьшей ошибкой. Для примера, представленного в табл. 3.1, в результате будут получены правила и их оценки, приведенные в табл. 3.2. Таблица 3.2 Правила классификации и их оценки Правило Ошибка Если (наблюдение = солнце) то (игра = нет) 2/5 Если (наблюдение = облачно) то (игра = да) 0/4 Если (наблюдение = дождь) то (игра = да) 2/5 Если (температура = жарко) то (игра = нет) 2/4 Если (температура = норма) то (игра = да) 2/6 Если (температура = холодно) то (игра = да) 1/4 Если (влажность = высокая) то (игра = нет) 3/7 Если (влажность = норма) то (игра = да) 1/7 Если (ветер = нет) то (игра = да) 2/8 Если (ветер = есть) то (игра = нет) 3/6 Если в обучающей выборке встречаются объекты с пропу- щенными значениями независимых переменных, то алгоритм 1R подсчитывает такие объекты для каждого возможного значения переменной. Другой проблемой для рассматриваемого алгоритма являют- ся численные значения переменных. Очевидно, что если перемен-