Технологии интеллектуального анализа данных : учебное пособие
150 Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы информации, делать их компактными и наглядными. Задача кластеризации состоит в разделении исследуемого множества объектов на группы «похожих» объектов, называемых кластерами. Слово кластер английского происхождения (cluster), переводится как сгусток, пучок, группа. Родственные понятия, ис- пользуемые в литературе, – класс, таксон, сгущение. Часто реше- ние задачи разбиения множества элементов на кластеры называют кластерным анализом. Решением задачи классификации является отнесение каждого из объектов данных к одному (или нескольким) из заранее опреде- ленных классов и построение в конечном счете одним из методов классификации модели данных, определяющей разбиение множе- ства объектов данных на классы. В задаче кластеризации отнесение каждого из объектов дан- ных осуществляется к одному (или нескольким) из заранее неопре- деленных классов. Разбиение объектов данных по кластерам осуще- ствляется при одновременном их формировании. Определение кла- стеров и разбиение по ним объектов данных выражается в итоговой модели данных, которая является решением задачи кластеризации. Отметим ряд особенностей, присущих задаче кластеризации: во-первых, решение сильно зависит от природы объектов данных (и их атрибутов). Так, с одной стороны, это могут быть одно- значно определенные, четко количественно очерченные объекты, а с другой – объекты, имеющие вероятностное или нечеткое описание. во-вторых, решение значительно зависит также и от пред- ставления классов (кластеров) и предполагаемых отношений объ- ектов данных и классов (кластеров). Так, необходимо учитывать такие свойства, как возможность/невозможность принадлежности
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy