Технологии интеллектуального анализа данных : учебное пособие

156  расстояние по Хеммингу – среднее разностей по координа- там. В большинстве случаев данная мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида, од- нако для нее влияние отдельных больших разностей (выбросов) уменьшается (так как они не возводятся в квадрат). Расстояние по Хеммингу вычисляется по формуле   1 , | | m H i j it jt t d x x x x      ;  расстояние Чебышева – может оказаться полезным, когда желают определить два объекта как «различные», если они разли- чаются по какой-либо одной координате (каким-либо одним изме- рением). Расстояние Чебышева вычисляется по формуле   1 , max | | i j it jt t m d x x x x      ;  расстояние Махаланобиса преодолевает этот недостаток, но данная мера расстояния плохо работает, если ковариационная матрица высчитывается на всем множестве входных данных. В то же время, будучи сосредоточенной на конкретном классе (группе данных), данная мера расстояния показывает хорошие результаты:       1 , t M i j i j i j d x x x x S x x     ;  пиковое расстояние предполагает независимость между случайными переменными, что говорит о расстоянии в ортогональ- ном пространстве, но в практических приложениях эти переменные не являются независимыми:   1 | | 1 , m it jt L i j it jt t x x d x x m x x      .

RkJQdWJsaXNoZXIy MTY0OTYy