Технологии интеллектуального анализа данных : учебное пособие

295 Введем еще два определения: чувствительность и специфич- ность модели. Ими определяется объективная ценность любого би- нарного классификатора. Чувствительность (Sensitivity) – это и есть доля истинно по- ложительных случаев: TP TPR 100 % TP FN Se     . Специфичность (Specificity) – доля истинно отрицательных случаев, которые были правильно идентифицированы моделью: TN 100 % TN FP Sp    . Модель с высокой чувствительностью часто дает истинный результат при наличии положительного исхода (обнаруживает по- ложительные примеры). Наоборот, модель с высокой специфично- стью чаще дает истинный результат при наличии отрицательного исхода (обнаруживает отрицательные примеры). Если рассуждать в терминах медицины – задачи диагностики заболевания, где модель классификации пациентов на больных и здоровых называется ди- агностическим тестом, то получится следующее:  чувствительный диагностический тест проявляется в ги- пердиагностике – максимальном предотвращении пропуска боль- ных;  специфичный диагностический тест диагностирует только доподлинно больных. Это важно в случае, когда, например, лече- ние больного связано с серьезными побочными эффектами и ги- пердиагностика пациентов нежелательна. ROC-кривая получается следующим образом: для каждого значения порога отсечения, которое меняется от 0 до 1 с шагом, например, 0,01, рассчитываются значения чувствительности Se и