Технологии интеллектуального анализа данных : учебное пособие
273 качества можно определить оптимальный порог (оптимальный балл). Продолжим пример об оценке кредитоспособности физиче- ских лиц, рассмотренный в разд., посвященном нейронным сетям. Покажем, как при помощи логистической регрессии построить несложную скоринговую карту – список характеристик заемщика с их весами (баллами). Всех заемщиков можно разделить на два класса – кредито- способных и некредитоспособных. Поскольку в кредитовании об- щепринято, что чем выше кредитоспособность клиента, тем боль- ше его рейтинговый балл, обозначим в обучающем множестве по- ложительным исходом успешный возврат кредита, а отрицатель- ным – дефолт по займу. Для лучшей интерпретации регрессионных коэффициентов всем качественным переменным рекомендуется делать нормализацию битовой маской. В этом случае для каждого уникального значения качественного признака будет подбираться свой коэффициент (балл). От фактора «Автомобиль» здесь отка- жемся. Тогда при бинаризации качественной переменной «Образо- вание» в уравнение регрессии будут введены две дополнительных независимых переменных. В итоге получим семь переменных плюс одну переменную для константы. Рассчитанные коэффициенты ло- гистической регрессии сведем в табл. 4.25. Таблица 4.25 Коэффициенты логистической регрессии № Переменная Коэффициент 1 Сумма кредита -4,5-10 -4 2 Возраст -0,03 3 Образование среднее 0,915 4 Образование специальное 1,356 5 Образование высшее 1,376 6 Площадь квартиры 0,027 7 Срок проживания 0,018 8 Константа -0,02
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy