Технологии интеллектуального анализа данных : учебное пособие

103 классы распределены в множестве Т и его подмножествах, полу- чаемых при разбиении. Именно она и используется при выборе пе- ременной. В данном случае существует четыре варианта разбиения дерева (рис. 3.2). Рис. 3.2. Варианты первоначального разбиения дерева для разных переменных Пусть freq   , r c I – количество объектов из множества I , от- носящихся к одному и тому же классу c r . Тогда вероятность того, что случайно выбранный объект из множества I будет принадле- жать классу c r :   , | | r freq c I P I  . Так, для примера, рассмотренного в табл. 3.1, вероятность того, что в случайно выбранный день игра состоится, равна 9/14. Перспектива Температура Солнце Облачно Дождь Низкая Средняя Высокая Да Да Нет Нет Нет Да Да Да Нет Нет Да Да Да Да Да Да Нет Нет Да Да Да Да Нет Нет Да Да Да Нет Влажность Ветер Высокая Нормальная Нет Да Да Да Да Нет Нет Нет Нет Да Да Да Да Да Нет Нет Да Да Да Да Да Да Да Нет Да Да Да Нет Нет Нет

RkJQdWJsaXNoZXIy MTY0OTYy