Технологии интеллектуального анализа данных : учебное пособие

155   , j p d i i в строке j и столбце p. Очевидно, что на главной диагона- ли значения будут равны нулю:             1 2 1 2 1 2 1 2 0 , ... , , 0 , ... , , 0 n n n n d e e d e e d e e d e e D d e e d e e                . Меры близости, основанные на расстояниях и используемые в алгоритмах кластеризации. Расстояния между объектами предпо- лагают их представление в виде точек m -мерного пространства R m . В этом случае могут быть использованы различные подходы к вы- числению расстояний. Рассматриваемые далее меры определяют расстояния между двумя точками, принадлежащими пространству входных перемен- ных. Введем следующие обозначения:  Х Q  R m – множество данных, являющееся подмножеством m -мерного вещественного пространства;    1 ,..., i i im x x x  Х Q , i = 1.. Q – элементы множества данных;  1 1 Q i i x x Q    – среднее значение точек данных;     1 1 1 Q t i i i S x x x x Q       – ковариационная матрица ( m  m ). Итак, приведем наиболее известные меры близости:  евклидово расстояние – вычисляется следующим обра- зом:     2 2 1 , m i j it jt t d x x x x     ;

RkJQdWJsaXNoZXIy MTY0OTYy