Технологии интеллектуального анализа данных : учебное пособие
64 Описательные методы служат для нахождения шаблонов или образцов, описывающих данные, которые поддаются интерпрета- ции с точки зрения аналитика. К методам, направленным на полу- чение описательных результатов, относятся итеративные методы кластерного анализа, в том числе: алгоритм k -средних, k -медианы, иерархические методы кластерного анализа, самоорганизующиеся карты Кохонена, методы кросс-табличной визуализации, различ- ные методы визуализации и др. Прогнозирующие методы используют значения одних пере- менных для предсказания/прогнозирования неизвестных (пропу- щенных) или будущих значений других (целевых) переменных. К методам, направленным на получение прогнозирующих ре- зультатов, относятся: нейронные сети, деревья решений, линейная регрессия, метод ближайшего соседа, метод опорных векторов и др. Различные методы Data Mining характеризуются определен- ными свойствами, которые могут быть определяющими при выбо- ре метода анализа данных. Методы можно сравнивать между со- бой, оценивая характеристики их свойств. Среди основных свойств и характеристик методов Data Mining рассмотрим следующие: точность, масштабируемость, ин- терпретируемость, проверяемость, трудоемкость, гибкость, быст- роту и популярность. 2.7. Методы и модели Data Mining Задача классификации и регрессии При анализе часто требуется определить, к какому из извест- ных классов относятся исследуемые объекты, т.е. классифициро- вать их. Например, когда человек обращается в банк за предостав- лением ему кредита, банковский служащий должен принять реше- ние: кредитоспособен ли потенциальный клиент или нет. Очевид-
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy