Технологии интеллектуального анализа данных : учебное пособие

54 альны, практически полезны, доступны для интерпретации челове- ком. Основная особенность Data Mining – это сочетание широкого математического инструментария (от классического статистиче- ского анализа до новых кибернетических методов) и последних достижений в сфере информационных технологий. В технологии Data Mining гармонично объединились строго формализованные методы и методы неформального анализа, т.е. количественный и качественный анализ данных. Свойства обнаруживаемых знаний:  знания должны быть новые, ранее неизвестные. Затрачен- ные усилия на открытие знаний, которые уже известны пользова- телю, не окупаются. Поэтому ценность представляют именно но- вые, ранее неизвестные знания;  знания должны быть нетривиальны. Результаты анализа должны отражать неочевидные, неожиданные закономерности в данных, составляющие так называемые скрытые знания. Результа- ты, которые могли бы быть получены более простыми способами (например, визуальным просмотром), не оправдывают привлечение мощных методов Data Mining;  знания должны быть практически полезны. Найденные знания должны быть применимы, в том числе и на новых данных, с достаточно высокой степенью достоверности. Полезность заключа- ется в том, чтобы эти знания могли принести определенную выгоду при их применении;  знания должны быть доступны для понимания человеку. Найденные закономерности должны быть логически объяснимы, в противном случае существует вероятность, что они являются слу- чайными. Кроме того, обнаруженные знания должны быть пред- ставлены в понятном для человека виде.

RkJQdWJsaXNoZXIy MTY0OTYy