Технологии интеллектуального анализа данных : учебное пособие

151 объектов нескольким классам (кластерам). Необходимо определе- ние самого понятия принадлежности классу (кластеру): однознач- ная (принадлежит/не принадлежит), вероятностная (вероятность принадлежности), нечеткая (степень принадлежности). Ввиду особого положения задачи кластеризации в списке за- дач интеллектуального анализа данных было разработано множе- ство способов ее решения. Один из них – построение набора харак- теристических функций классов, которые показывают, относится ли объект данных к данному классу или нет. Характеристическая функция класса может быть двух типов: 1) дискретная функция, принимающая одно из двух определен- ных значений, смысл которых в принадлежности/непринадлежности объекта данных заданному классу; 2) функция, принимающая вещественные значения, например из интервала 0...1. Чем ближе значение функции к единице, тем больше объект данных принадлежит заданному классу. Общий подход к решению задачи кластеризации стал возмо- жен после развития Л. Заде теории нечетких множеств. В рамках данного подхода удается формализовать качественные понятия, неопределенность, присущую реальным данным и процессам. Ус- пех этого подхода объясняется еще и тем, что в процессе анализа данных участвует человек, оценки и суждения которого расплыв- чаты и субъективны. При использовании теории нечетких множеств для решения задачи кластеризации возможны различные варианты введения не- четкости в методы, решающие данную задачу. Нечеткость может учитываться как в представлении данных, так и при описании их взаимосвязи. Кроме того, данные могут как обладать, так и не об- ладать количественной природой. Тем не менее во многих практи- ческих задачах данные, которые необходимо исследовать, являют-