Технологии интеллектуального анализа данных : учебное пособие

115 Однако в полученном подмножестве отсутствует один из объектов, относящихся к классу «жесткие», поэтому необходимо решить, какое из последних двух правил более приемлемо для ана- литика. Методы построения математических функций Методы, рассмотренные для правил и деревьев решений, рабо- тают наиболее естественно с категориальными переменными. Их можно адаптировать для работы с числовыми переменными, однако существуют методы, которые наиболее естественно работают с ними. При построении математической функции классификации или регрессии основная задача сводится к выбору наилучшей функции из всего множества вари- антов. Дело в том, что может су- ществовать множество функций, одинаково классифицирующих од- ну и ту же обучающую выборку. Данная проблема проиллюстриро- вана на рис. 3.5. Каждая из трех линий ус- пешно разделяет все точки на два класса (представленные на рисунке квадратами и кружками), однако модель должна быть представлена одной функцией, которая наи- лучшим образом решит задачу для новых объектов. В результате задачу построения функции классификации и регрессии можно формально описать как задачу выбора функции с минимальной степенью ошибки:     1 1 min ( ) , m i i f F i R f c y f x m     , (3.1) Рис. 3.5. Варианты линейного разделения обучающей выборки

RkJQdWJsaXNoZXIy MTY0OTYy