Технологии интеллектуального анализа данных : учебное пособие

272 отрицательным – «Здоровый пациент». И наоборот, если ставится задача определить вероятность того, что человек здоров, то положи- тельным исходом будет класс «Здоровый пациент» и т.д. Настройка обучающей выборки. Настройка обучающей вы- борки такая же, как для нейронной сети и других алгоритмов по- строения моделей. Обучение логистической регрессионной модели. Под обуче- нием понимается расчет коэффициентов регрессионной модели, например, бинарной логистической регрессии. Параметры обуче- ния логистической модели следующие:  максимальное число итераций – алгоритм расчета коэффи- циентов завершится, когда очередное значение логарифмической функции правдоподобия -2*Log likehood прекратит изменяться в пределах заданной точности;  точность функции оценки – параметр влияет на количество итераций алгоритма до его успешной сходимости;  порог отсечения – задача бинарной классификации будет решена на основе заданного порога отсечения для поля со значени- ем рейтинга. В результате работы алгоритма на выходе обработчика к ис- ходному набору данных добавляются два поля: 1) <Имя выходного поля>Рейтинг – значение выхода в урав- нении логистической регрессии от 0 до 1; 2) <Имя выходного поля>_ОUT – выходное поле, полученное на основе поля с рейтингом с использованием порога отсечения k : всем примерам, большим или равным k , приписывается положи- тельный исход, остальным – отрицательный исход прогнозируемо- го события. В самом простом случае в качестве порога можно взять значение 0,5. Однако при наличии некоторого критерия