Технологии интеллектуального анализа данных : учебное пособие
262 Распознанным считается пример, для которого отклонение расчет- ного и реального значения не больше средней ошибки; тестовое множество – остановка обучения производится по достижении на тестовом множестве заданной средней ошибки, максимальной ошибки или процента распознанных примеров. Рас- познанным считается пример, для которого отклонение расчетного и реального значений не больше средней ошибки. Остановка обучения происходит по достижении любого из заданных условий остановки. Теперь все готово к процессу обучения нейронной сети. В начале все веса нейросети инициализируются случайными зна- чениями. После обучения эти веса принимают определенные зна- чения. Обучение может с большой долей вероятности считаться успешным, если процент распознанных примеров на обучающем и тестовом множествах достаточно велик (близок к 100 %). Рассмотрим пример построения системы оценки кредитоспо- собности физического лица. Предположим, что эксперты опреде- лили основные факторы, определяющие кредитоспособность. Ими оказались: возраст, образование, площадь квартиры, наличие авто- мобиля, длительность проживания в данном регионе. В организа- ции была накоплена статистика возвратов или невозвратов взятых кредитов. Эта статистика представлена табл. 4.19. Данная таблица является обучающей выборкой для нейрон- ной сети. Теперь необходимо нормализовать поля. Поля «Сумма кре- дита», «Возраст», «Площадь квартиры» и «Длительность прожива- ния» имеют непрерывные значения, которые преобразуем к интер- валу [-1..1]. Образование представлено тремя уникальными значе- ниями, которые можно сравнивать на большее или меньшее, а точ- нее лучшее или худшее, т.е. образование можно упорядочить так:
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy