Технологии интеллектуального анализа данных : учебное пособие

221 ются на две группы. Как правило, одна из них большего размера, другая – меньшего. На большей группе, применяя те или иные ме- тоды Data Mining , получают модели, а на меньшей – проверяют их. По разнице в точности между тестовой и обучающей группами можно судить об адекватности построенной модели. После этого можно переходить к интерпретации полученных моделей челове- ком в целях их использования для принятия решений, добавления полученных правил и зависимостей в базы знаний и т.д. Данный этап часто подразумевает использование методов, находящихся на стыке Data Mining и технологии экспертных систем. От того, на- сколько эффективным он будет, в значительной степени зависит успех решения поставленной задачи. Рассмотренным этапом завершается цикл обнаружения зна- ний в базах данных Окончательная оценка ценности добытого но- вого знания выходит за рамки анализа, автоматизированного или традиционного, и может быть проведена только после претворения в жизнь решения, принятого на основе добытого знания, после проверки его на практике. Исследование достигнутых практиче- ских результатов завершает оценку ценности добытого средствами Data Mining нового знания. Основные этапы процесса KDD могут быть представлены в виде структурной схемы (рис. 4.2). Рис. 4.2. Типовая схема технологии KDD Выборка Подготовка Преобразование Оценка Знания Данные Исходные данные Подготов- ленные данные Преобра- зованные данные Модели Data Mining

RkJQdWJsaXNoZXIy MTY0OTYy