Технологии интеллектуального анализа данных : учебное пособие

163 Рис. 3.15. Представление ирисов в двумерном пространстве Вначале выбирается k произвольных исходных центров – точек в пространстве всех объектов. Не очень критично, какие именно это будут центры, процедура выбора исходных точек от- разится, главным образом, только на времени счета. Например, это могут быть первые k объектов множества I . В данном примере это точки 1, 2 и 3. Дальше итерационно выполняется операция, состоящая из двух шагов. На первом шаге все объекты разбиваются на k групп, наибо- лее близких к одному из центров. Близость определяется расстоя- нием, которое вычисляется одним из описанных ранее способов (например, берется Евклидово расстояние). Рис. 3.16 иллюстрирует разбиение ирисов на три кластера. На втором шаге вычисляются новые центры кластеров. Цен- тры можно вычислить как средние значения переменных объектов, отнесенных к сформированным группам. Новые центры, естест- венно, могут отличаться от предыдущих. На рис. 3.17 отмечены новые центры и новое разделение в соответствии с ними. Естест- венно, что некоторые точки, ранее относящиеся к одному кластеру, при новом разбиении попадают в другой (в данном случае такими 103 105 104 102 101 55 51 53 52 54 2 2 4 1 5 7,5 7 6,5 6 5,5 5 4,5 4 Длина 2 2,5 3 3,5 4 4,5 5 Ширина

RkJQdWJsaXNoZXIy MTY0OTYy