Технологии интеллектуального анализа данных : учебное пособие
67 построенная на ее основе функция классификации или регрес- сии; в выборку должны входить объекты, представляющие все возможные классы в случае задачи классификации или всю область значений в случае задачи регрессии; для каждого класса в задаче классификации или каждого интервала области значений в задаче регрессии выборка должна содержать достаточное количество объектов. На втором этапе построенную модель применяют к анализи- руемым объектам (к объектам с неопределенным значением зави- симой переменной). Задача классификации и регрессии имеет геометрическую интерпретацию. Рассмотрим ее на примере с двумя независимыми переменными, что позволит представить ее в двумерном простран- стве (рис. 2.8). Каждому объекту ставится в соответствие точка на плоскости. Символы «+» и «-» обозначают принадлежность объек- та к одному из двух классов. Очевидно, что данные имеют четко выраженную структуру: все точки класса «+» сосредоточены в цен- тральной области. Построение классификационной функции сво- дится к построению поверхности, которая обводит центральную область. Она определяется как функция, имеющая значения «+» внутри обведенной области и «-» – вне. Рис. 2.8. Классификация в двумерном пространстве Х 2 d c a b Х 1 Х 2 Х 1 Х 1 Х 2
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy