Технологии интеллектуального анализа данных : учебное пособие

257 2. Уникальные значения – используется для дискретных зна- чений. Такими являются строки, числа или даты, заданные дис- кретно. Чтобы привести непрерывные числа в дискретные, можно, например, воспользоваться обработкой «квантование». Так следует поступать с величинами, для которых можно задать отношение по- рядка, т.е. если для двух любых дискретных значений можно ука- зать, какое больше, а какое меньше. Тогда все значения необходи- мо расположить в порядке возрастания. Далее они нумеруются по порядку и значения заменяются их порядковым номером. 3. Битовая маска – используется для дискретных значений. Этот вид нормализации следует использовать для величин, которые можно только сравнивать на равенство или неравенство, но нельзя сказать, какое больше, а какое меньше. Все значения заменяются порядковыми номерами, а номер рассматривается в двоичном виде или в виде маски из нулей и единиц. Тогда каждая позиция маски рассматривается как отдельное поле, содержащее ноль или едини- цу. К такому полю можно применить линейную нормализацию, т.е. заменить ноль некоторым минимальным значением, а единицу – максимальным. После подобной нормализации на вход нейронной сети будет подаваться не одно это поле, а столько полей, сколько разрядов в маске. Рассмотрим примеры нормализации полей (табл. 4.16-4.18). 1. Линейная нормализация. Приведем значения к диапазону [0..1]. Таблица 4.16 Линейная нормализация Поле до нормализации Поле после нормализации -5 0 2.3 0,81111 1.1 0,67778 4 1 3.5 0,94444

RkJQdWJsaXNoZXIy MTY0OTYy