Технологии интеллектуального анализа данных : учебное пособие
247 или присоединяемом наборе данных. Такие поля можно добавить к результирующей выборке, образующейся после слияния. Слияние необходимо, когда к информации, содержащейся в некотором наборе данных, необходимо добавить дополнительную информацию из другого набора данных. Слияние позволяет соеди- нять и обрабатывать необходимым образом наборы данных, полу- ченные из разных, не связанных между собой источников данных. Замена данных. В результате выполнения этой операции производится замена значений по таблице подстановки, которая содержит пары, состоящие из исходного значения и выходного значения. Например, 0 – «красный», 1 – «зеленый», 2 – «синий». Или «зима» – «январь», «весна» – «апрель», «лето» – «июль», «осень» – «октябрь». Для каждого значения исходного набора данных ищется соответствие среди исходных значений таблицы подстановки. Если соответствие найдено, то значение меняется на соответствующее выходное значение из таблицы подстановки. Если значение не найдено в таблице, оно может быть либо заме- нено значением, указанным для замены «по умолчанию», либо оставлено без изменений (если такое значение не указано). Кроме того, можно указать значения, которые нужно вставить вместо пустых ячеек. Пусть, например, есть список клиентов и каждый клиент ка- ким-либо образом отнесен в одну из трех групп. Группа задана но- мером (табл. 4.8). Таблица 4.8 Клиенты и их группы Наименование клиента Группа Клиент 1 1 Клиент 2 3 Клиент 3 2 Клиент 4 1 Клиент 5 2
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy