Технологии интеллектуального анализа данных : учебное пособие
156 расстояние по Хеммингу – среднее разностей по координа- там. В большинстве случаев данная мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида, од- нако для нее влияние отдельных больших разностей (выбросов) уменьшается (так как они не возводятся в квадрат). Расстояние по Хеммингу вычисляется по формуле 1 , | | m H i j it jt t d x x x x ; расстояние Чебышева – может оказаться полезным, когда желают определить два объекта как «различные», если они разли- чаются по какой-либо одной координате (каким-либо одним изме- рением). Расстояние Чебышева вычисляется по формуле 1 , max | | i j it jt t m d x x x x ; расстояние Махаланобиса преодолевает этот недостаток, но данная мера расстояния плохо работает, если ковариационная матрица высчитывается на всем множестве входных данных. В то же время, будучи сосредоточенной на конкретном классе (группе данных), данная мера расстояния показывает хорошие результаты: 1 , t M i j i j i j d x x x x S x x ; пиковое расстояние предполагает независимость между случайными переменными, что говорит о расстоянии в ортогональ- ном пространстве, но в практических приложениях эти переменные не являются независимыми: 1 | | 1 , m it jt L i j it jt t x x d x x m x x .
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy