Технологии интеллектуального анализа данных : учебное пособие

265 Чем больше правильно классифицированных записей, тем лучше построенная модель. Линейная регрессия В результате работы данного компонента строится линейная модель данных. Применяется следующий алгоритм построения мо- дели. Пусть имеется набор входных значений X i , где i = l ... n , т.е.   2 , ,..., i n X X X . Тогда можно указать такой набор выходных значений Y j ( j = l ... m ), который будет соответствовать линейной комбинации входных значений с коэффициентами a i ( i = l … n ):      2 0 1 2 1 2 , ,..., , , ,..., , ,..., i n n m X X X a a a a Y Y Y  . Если для простоты предположить, что выходное значение одно, то можно записать a 0 + X 1 a 1 + X 2 a 2 +...+ X n a n = Y . Таким обра- зом, задача сводится к подбору коэффициентов a i . Подбор произ- водится путем итеративного обучения модели, когда на входные поля подается обучающий набор данных, а на выход – целевое зна- чение Y . Целью обучения является получение такого набора коэф- фициентов линейного преобразования a i , при котором ошибка рас- согласования реального Y и рассчитанного Y ´ значений выходов будет минимальной. Линейная регрессия может быть получена с помощью нейро- сетей. Для этого нужно создать нейронную сеть с одним внутрен- ним слоем, состоящим из одного нейрона и с линейной функцией активации. С помощью линейной регрессии модель может быть построена в несколько раз быстрее, поэтому ее эффективней при- менять на больших наборах данных. Однако нужно помнить, что она предназначена для поиска линейных зависимостей в данных. Если же зависимости нелинейные, то модель с использованием ли-