Технологии интеллектуального анализа данных : учебное пособие

116 где F – множество всех возможных функций; c ( y i , f ( x i )) – функция потерь (loss function), в которой f ( x i ) есть значение зависимой пере- менной, найденное с помощью функции f для вектора x i  T , а y – ее точное (известное) значение. Следует отметить, что функция потерь принимает неотрица- тельные значения. Это означает, что невозможно получить «возна- граждение» за очень хорошее предсказание. Если выбранная функ- ция потерь все же принимает отрицательные значения, то это легко исправить, вводя положительный сдвиг (возможно, с зависимостью от х ). Такими же простыми средствами можно добиться нулевых потерь при абсолютно точном предсказании f ( x ) = у. Преимущества подобного ограничения функции потерь заключаются в том, что всегда известен минимум и известно, что он достижим (по крайней мере, для данной пары х , у ). Для задач классификации и регрессии такие функции имеют разный вид. Так, в случае бинарной классификации (принадлежно- сти объекта к одному из двух классов; далее первый класс обозна- чается через +1, а второй класс – через –1) простейшая функция потерь (называемая «0–1 loss» в англоязычной литературе) прини- мает значение 1 в случае неправильного предсказания и 0 в про- тивном случае:   0, ( ); , , ( ) 1, ( )). y f x c x y f x y f x       Здесь не учитывается ни тип ошибки f ( x ) = 1 ( у = –1 – поло- жительная ошибка, f ( x ) = –1, у = 1 – отрицательная ошибка), ни ее величина. Небольшое изменение позволяет учесть характер ошибки:   0, ( ); ( , , ( ) , , ( ) , ( ). y f x c x y f x c x y f x y f x      