Технологии интеллектуального анализа данных : учебное пособие

157 Любую из приведенных мер расстояния можно выбирать с уверенностью лишь в том случае, если имеется информация о ха- рактере данных, подвергаемых кластеризации. Представление результатов Результатом кластерного анализа является набор кластеров, содержащих элементы исходного множества. Кластерная модель должна описывать как сами кластеры, так и принадлежность каж- дого объекта к одному из них. Для небольшого числа объектов, характеризующихся двумя переменными, результаты кластерного анализа изображают графи- чески. Элементы представляются точками, кластеры разделяются прямыми, которые описываются линейными функциями. Для при- мера с данными из табл. 3.14 результат кластеризации можно пред- ставить диаграммой, изображенной на рис. 3.13, а . Если кластеры нельзя разделить прямыми, то рисуются ло- маные линии, которые описываются нелинейными функциями. В случае, если элемент может принадлежать нескольким кла- стерам, то можно использовать Венские диаграммы (рис. 3.13, б ). Некоторые алгоритмы не просто относят элемент к одному из кластеров, а определяют вероятность его принадлежности. В этом случае удобнее представлять результат их работы в виде таблицы. В ней строки соответствуют элементам исходного мно- жества, столбцы – кластерам, а в ячейках указывается вероятность принадлежности элемента к кластеру. Ряд алгоритмов кластеризации строят иерархические структу- ры кластеров. В таких структурах самый верхний уровень соответст- вует всему множеству объектов, т.е. одному–единственному класте- ру. На следующем уровне он делится на несколько подкластеров, каждый из которых делится еще на несколько и т.д. Построение та- кой иерархии может происходить до тех пор, пока кластеры не будут

RkJQdWJsaXNoZXIy MTY0OTYy