Технологии интеллектуального анализа данных : учебное пособие

282 лее удобной является использование для раскраски цветной палит- ры. В принципе можно использовать любую градиентную палитру для раскраски. Полученные раскраски в совокупности образуют атлас, отображающий расположение компонент, связи между ними, а также относительное расположение различных значений компо- нент. Продолжим рассмотрение примера с кредитованием физиче- ских лиц. С помощью самоорганизующихся карт Кохонена можно посмотреть зависимости между различными характеристиками за- емщиков и выделить сегменты заемщиков, объединив их по схо- жим признакам. Обучающей выборкой будет та же, что и для нейросетей и деревьев решений. Но поле «Автомобиль» использовать не будем. Это нецелесообразно, так как данные, подаваемые на вход карт Ко- хонена, должны быть такими, чтобы между ними можно было вы- числить расстояние или, по крайней мере, была возможность рас- положить их в порядке возрастания или убывания. Значения же «отечественный», «импортный» и «нет автомобиля» сравнивать между собой не совсем корректно. Результаты работы алгоритма отображаются на картах. Каж- дому входному полю соответствует своя карта (рис. 4.24). К примеру, в один и тот же кластер были сгруппированы мо- лодые заемщики с маленьким сроком проживания в данной мест- ности, специальным или средним образованием, средней жилпло- щадью, берущие высокие суммы кредита. В результате кластериза- ции заемщики со схожими характеристиками попадут в один кла- стер и поэтому для них можно применять одинаковые правила вы- дачи кредита, т.е. для каждого кластера определить, стоит ли выда- вать кредит его представителям.

RkJQdWJsaXNoZXIy MTY0OTYy