Технологии интеллектуального анализа данных : учебное пособие
54 альны, практически полезны, доступны для интерпретации челове- ком. Основная особенность Data Mining – это сочетание широкого математического инструментария (от классического статистиче- ского анализа до новых кибернетических методов) и последних достижений в сфере информационных технологий. В технологии Data Mining гармонично объединились строго формализованные методы и методы неформального анализа, т.е. количественный и качественный анализ данных. Свойства обнаруживаемых знаний: знания должны быть новые, ранее неизвестные. Затрачен- ные усилия на открытие знаний, которые уже известны пользова- телю, не окупаются. Поэтому ценность представляют именно но- вые, ранее неизвестные знания; знания должны быть нетривиальны. Результаты анализа должны отражать неочевидные, неожиданные закономерности в данных, составляющие так называемые скрытые знания. Результа- ты, которые могли бы быть получены более простыми способами (например, визуальным просмотром), не оправдывают привлечение мощных методов Data Mining; знания должны быть практически полезны. Найденные знания должны быть применимы, в том числе и на новых данных, с достаточно высокой степенью достоверности. Полезность заключа- ется в том, чтобы эти знания могли принести определенную выгоду при их применении; знания должны быть доступны для понимания человеку. Найденные закономерности должны быть логически объяснимы, в противном случае существует вероятность, что они являются слу- чайными. Кроме того, обнаруженные знания должны быть пред- ставлены в понятном для человека виде.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy