Технологии интеллектуального анализа данных : учебное пособие
117 Здесь , , ( ) c x y f x может учитывать многие параметры клас- сифицируемого объекта и характер ошибки. Ситуация усложняется в случае классификации с числом классов более двух. Каждый тип ошибки классификации в общем случае вносит свой тип потерь таким образом, что получается мат- рица размера k k (где k – число классов). При оценке величин, принимающих вещественные значения, целесообразно использовать разность f ( x ) – у для оценки качества классификации. Эта разность в случае регрессии имеет вполне оп- ределенный смысл (например, размер финансовых потерь при неправильной оценке стоимости финансового инструмента на рын- ке ценных бумаг). Учитывая условие независимости от положения, функция потерь будет иметь вид: , , ( ) ( ) c x y f x c f x y . Чаще всего применяется минимизация квадратов раз- ностей f ( x ) – y. Этот вариант соответствует наличию аддитивного нормально распределенного шума, влияющего на результаты на- блюдений y i . Соответственно, минимизируем следующее выражение: 2 , , ( ) ( ) c x y f x f x y . (3.2) Линейные методы. Метод наименьших квадратов Различают два вида функций: линейные и нелинейные. В первом случае функции множества F имеют вид 0 1 1 2 2 0 1 ... n n n j j j y x x x x . где 0 , 1 , …, n – коэффициенты при независимых переменных.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy