Технологии интеллектуального анализа данных : учебное пособие

290 4.8. Методы оценки данных и интерпретации результатов Одним из важных этапов анализа данных является интер- претация его результатов. Под интерпретацией результатов пони- мается их анализ экспертом предметной области. Результаты должны быть описаны на языке предметной области. Так как невозможно построить идеальную модель, необходимо оценить, удовлетворяет ли построенная модель запросам, проверить ее ка- чество. Например, после кластеризации (сегментации) клиентов по частоте и периодичности приобретения услуг, а также количеству приобретаемых услуг, каждому кластеру (сегменту) может быть сопоставлена степень важности или ценности входящих в него клиентов. Это и есть интерпретация полученных сегментов клиен- тов. Для решения задачи сегментации обычно используется исто- рия предоставления услуг за некоторый промежуток времени. По- этому точность отнесения клиентов к тому или иному сегменту бу- дет зависеть от объема выборки. Для оценки качества построенной модели часто используют- ся такие средства, как таблица сопряженности и диаграмма рассея- ния. Кроме того, в деревьях решений и ассоциативных правилах используются поддержка и достоверность по каждому узлу и по правилу целиком. Для оценки качества классификации данных обычно исполь- зуют таблицу сопряженности. При решения задачи классификации используется таблица, в которой уже есть выходной столбец, со- держащий класс объекта. После применения алгоритма добавляет- ся еще один столбец с выходным полем, но его значения уже вы- числяются, используя построенную модель. При этом значения в столбцах могут отличаться. Чем больше таких отличий, тем хуже

RkJQdWJsaXNoZXIy MTY0OTYy