Технологии интеллектуального анализа данных : учебное пособие

92 Логические типы, как правило, кодируют цифрами 1 и 0. Ис- тине ставят в соответствие значение 1, а ложь обозначают 0. Значениями категориальных переменных являются имена возможных состояний изучаемого объекта. Разумеется, таких со- стояний может быть больше двух. Их имена должны быть перечис- лены и пронумерованы в списке. В системе каждое имя из списка может быть представлено своим номером. В итоге категориальная переменная преобразуется в числовую переменную. Например, значение переменной наблюдение {солнце, облачность, дождь} можно заменить значениями {0, 1, 2}. Другой способ представления исходно категориальной пере- менной в системе – это замена возможных значений набором дво- ичных признаков. В наборе столько двоичных признаков, сколько имен содержится в списке возможных состояний объекта. При ана- лизе объекта значение 1 присваивается тому двоичному признаку, который соответствует состоянию объекта. Остальным присваива- ется значение 0. Например, для переменной наблюдения такими значениями будут: {001, 010, 100}. Разные алгоритмы решения задачи классификации и регрес- сии строят и используют различные способы определения значения зависимой переменной. Методы построения правил классификации Алгоритм построения 1-правил. Рассмотрим алгоритм фор- мирования элементарных правил для классификации объекта. Он строит правила по значению одной независимой переменной, по- этому в литературе его часто называют «1-правило» (1-rule) или кратко lR-алгоритм. Идея алгоритма очень проста. Для любого возможного зна- чения каждой независимой переменной формируется правило, ко-

RkJQdWJsaXNoZXIy MTY0OTYy