Технологии интеллектуального анализа данных : учебное пособие

280 ны взаимодействуют друг с другом. Величина этого взаимодейст- вия определяется расстоянием между нейронами на карте. При реализации алгоритма SOM заранее задается конфигу- рация сетки (прямоугольная или шестиугольная), а также количе- ство нейронов в сети. Некоторые исследователи рекомендуют ис- пользовать максимально возможное количество нейронов в карте. При этом начальный радиус обучения (neighbourhood) в значитель- ной степени влияет на способность обобщения при помощи полу- ченной карты. В случае, когда количество узлов карты превышает количество примеров в обучающей выборке, успех использования алгоритма в большой степени зависит от подходящего выбора на- чального радиуса обучения. Однако в случае, когда размер карты составляет десятки тысяч нейронов, время, требуемое на обучение карты, обычно бывает слишком велико для решения практических задач. Таким образом, необходимо достигать допустимый компро- мисс при выборе количества узлов. Подготовка обучающей выборки. Отличие в подготовке обу- чающей выборки в этом алгоритме заключается в том, что выход- ные поля в такой выборке могут отсутствовать совсем. Даже если в обучающей выборке будут присутствовать выходные поля, они не будут участвовать при обучении нейросети, однако они будут участвовать при отображении карт. Нормализация значений полей. Нормализация полей здесь такая же, как для нейросетей. Настройка обучающей выборки. Обучающая выборка на- страивается также, как и для нейросети и дерева решений. Обучение. Перед началом обучения карты необходимо проинициализировать весовые коэффициенты нейронов. Удачно выбранный способ инициализации может существенно уско- рить обучение и привести к получению более качественных ре-

RkJQdWJsaXNoZXIy MTY0OTYy