Технологии интеллектуального анализа данных : учебное пособие

276 2) классификация – деревья решений отлично справляются с задачами классификации, т.е. отнесения объектов к одному из за- ранее известных классов; 3) регрессия – если целевая переменная является непрерыв- ной, деревья решений позволяют установить зависимость целевой переменной от независимых (входных) переменных. Например, к этому классу относятся задачи численного прогнозирования (пред- сказания значений целевой переменной). Подготовка обучающей выборки. Для построения дерева ре- шений готовится обучающая выборка так же, как для нейронной сети. Разница заключается в том, что выходное поле для дерева решений может быть только одно и только дискретно. Нормализация значений полей . Для полей, подаваемых на входы и выход дерева решений, также задается нормализация. Можно задать либо линейную нормализацию, либо нормализацию уникальными значениями. Настройка обучающей выборки. Настройка обучающей вы- борки такая же, как для нейронной сети. Обучение дерева решений. Параметры обучения дерева ре- шений следующие:  минимальное количество примеров, при котором будет создан новый узел. Задается минимальное количество примеров, которое возможно в узле. Если примеров, которые попадают в дан- ный узел, будет меньше заданного, узел считается листом (т.е. дальнейшее ветвление прекращается). Чем больше этот параметр, тем менее ветвистым получается дерево;  строить дерево с более достоверными правилами в ущерб сложности – специальный алгоритм, который, усложняя структуру дерева, увеличивает достоверность результатов классификации. При этом дерево получается, как правило, более ветвистым;