Технологии интеллектуального анализа данных : учебное пособие

62 Классификация, разделяющая все многообразие методов Data Mining на две группы: статистические и кибернетические, основана на различных подходах к обучению математических моделей. В этой классификации различают две группы методов: 1) статистические – основаны на использовании усредненного накопленного опыта, который отражен в ретроспективных данных; 2) кибернетические – включают множество разнородных ма- тематических подходов. Недостаток такой классификации: и статистические, и ки- бернетические алгоритмы тем или иным образом опираются на со- поставление статистического опыта с результатами мониторинга текущей ситуации. Преимущество такой классификации в ее удобстве для ин- терпретации – она используется при описании математических средств современного подхода к извлечению знаний из массивов исходных наблюдений (оперативных и ретроспективных), т.е. в задачах Data Mining. Рассмотрим подробнее представленные группы. Статистические методы Data Mining представляют собой че- тыре взаимосвязанных раздела: 1) предварительный анализ природы статистических данных (проверка гипотез стационарности, нормальности, независимости, однородности, оценка вида функции распределения, ее параметров и т.п.); 2) выявление связей и закономерностей (линейный и нели- нейный регрессионный анализ, корреляционный анализ и др.); 3) многомерный статистический анализ (линейный и нели- нейный дискриминантный анализ, кластерный анализ, компонент- ный анализ, факторный анализ и др.); 4) динамические модели и прогноз на основе временных рядов.