Технологии интеллектуального анализа данных : учебное пособие
274 В таблице наблюдаем пример простой скоринговой карты. Увеличение суммы кредита, как и возраста, уменьшают кредитный рейтинг (знак у коэффициента отрицательный). У кандидатов с высшим образованием рейтинг будет больше. За каждый год про- живания в регионе и каждый дополнительный квадратный метр жилой площади в собственности заемщику будет начислено по 0,018 и 0,027 балла. Оценить качество логистической регрессии как классифика- тора можно на основе таблицы сопряженности с порогом отсече- ния 0,5 (рис. 4.21). Рис. 4.21. Таблица сопряженности для оценки качества логистической регрессии В таблице сопряженности зафиксированы 18 случаев ложно- го обнаружения (заемщик признан благонадежным, тогда как по факту он «плохой») и 22 случая ложного пропуска («хорошему» клиенту было отказано). Доля верно классифицированных случаев составила чуть более 73 %. Это достаточно высокий показатель. Деревья решений Деревья решений (decision trees) являются одним из наиболее популярных подходов к решению задач добычи данных. Они соз- дают иерархическую структуру классифицирующих правил типа «ЕСЛИ...ТО...» (if-then), имеющую вид дерева. Чтобы принять ре- шение, к какому классу следует отнести некоторый объект или си- туацию, требуется ответить на вопросы, стоящие в узлах этого де- рева, начиная с его корня. Вопросы имеют вид «значение парамет-
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy