Технологии интеллектуального анализа данных : учебное пособие
56 сферах человеческой деятельности, в большинстве – это задачи, решение которых предусмотрено с использованием компьютера. Алгоритм ( algorithm ) – точное предписание относительно последовательности действий (шагов), преобразующих исходные данные в искомый результат. Data Mining может состоять из двух или трех стадий: стадия 1 – выявление закономерностей (свободный поиск); стадия 2 – использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделиро- вание); стадия 3 – анализ исключений – стадия предназначена для выявления и объяснения аномалий, найденных в закономерностях. Итак, процесс Data Mining может быть представлен рядом последовательных стадий (рис. 2.7). Рис. 2.7. Стадии процесса Data Mining Свободный поиск (Discovery) На стадии свободного поиска осуществляется исследование набора данных с целью поиска скрытых закономерностей. Предва- рительные гипотезы относительно вида закономерностей здесь не определяются. Закономерность (law) – существенная и постоянно повто- ряющаяся взаимосвязь, определяющая этапы и формы процесса становления, развития различных явлений или процессов. Система Data Mining на этой стадии определяет шаблоны, для получения которых в системах OLAP, например аналитику, необходимо обдумывать и создавать множество запросов. Здесь же аналитик освобождается от такой работы – шаблоны ищет за него Свободный поиск Прогностическое моделирование Анализ исключений
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy