Технологии интеллектуального анализа данных : учебное пособие
256 при обучении нейросети на один из ее входов подавались значения от 0 до 100, то в дальнейшем следует на этот вход подавать значе- ния из диапазона от 0 до 100. Допускается подавать значения, ле- жащие рядом с диапазоном. Настройка назначения полей. В самом начале работы с нейросетью нужно определиться, что является ее входами, а что выходами. Предполагается, что имеется таблица с обучающей выборкой. Обычно для ее подготовки пользуются методами очи- стки и трансформации данных – редактируются аномалии, за- полняются или удаляются пропуски, устраняются дубликаты и противоречия, производится квантование и табличная замена, данные приводятся к скользящему окну, преобразуется формат данных и т.д. Нормализация значений полей. После того, как указаны входные и выходные поля, следует нормализация данных в об- учающей выборке. Целью нормализации значений полей является преобразование данных к виду, наиболее подходящему для обра- ботки алгоритмом. Для таких обработчиков как нейронная сеть, дерево решений, линейная модель прогнозирования данные, посту- пающие на вход, должны иметь числовой тип, а их значения долж- ны быть распределены в определенном диапазоне. Нормализатор может преобразовать дискретные данные к набору уникальных ин- дексов или значения, лежащие в произвольном диапазоне к диапа- зону [0..1]. Для нейросети доступны следующие виды нормализа- ции полей. 1. Линейная нормализация – используется только для непре- рывных числовых полей. Позволяет привести числа к диапазону [min..max], т.е. минимальному числу из исходного диапазона будет соответствовать min, а максимальному – max. Остальные значения распределяются между min и max.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy