Технологии интеллектуального анализа данных : учебное пособие
155 , j p d i i в строке j и столбце p. Очевидно, что на главной диагона- ли значения будут равны нулю: 1 2 1 2 1 2 1 2 0 , ... , , 0 , ... , , 0 n n n n d e e d e e d e e d e e D d e e d e e . Меры близости, основанные на расстояниях и используемые в алгоритмах кластеризации. Расстояния между объектами предпо- лагают их представление в виде точек m -мерного пространства R m . В этом случае могут быть использованы различные подходы к вы- числению расстояний. Рассматриваемые далее меры определяют расстояния между двумя точками, принадлежащими пространству входных перемен- ных. Введем следующие обозначения: Х Q R m – множество данных, являющееся подмножеством m -мерного вещественного пространства; 1 ,..., i i im x x x Х Q , i = 1.. Q – элементы множества данных; 1 1 Q i i x x Q – среднее значение точек данных; 1 1 1 Q t i i i S x x x x Q – ковариационная матрица ( m m ). Итак, приведем наиболее известные меры близости: евклидово расстояние – вычисляется следующим обра- зом: 2 2 1 , m i j it jt t d x x x x ;
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy