Технологии интеллектуального анализа данных : учебное пособие

248 Понять, что представляет каждый клиент по такой табли- це, невозможно, но что соответствует каждой группе, известно (табл. 4.9) Таблица 4.9 Наименование групп Группа Наименование 1 Постоянные 2 Случайные 3 Потерянные Это таблица подстановки. Воспользуемся ею для замены зна- чений группы в таблице клиентов (табл. 4.10). Таблица 4.10 Клиенты и наименования их групп Наименование клиента Группа Клиент 1 Постоянные Клиент 2 Потерянные Клиент 3 Случайные Клиент 4 Постоянные Клиент 5 Случайные Группировка. Аналитику для принятия решения часто необ- ходима сводная информация, т.е. сгруппированные данные, кото- рые намного более информативны, особенно если их можно полу- чить в разных разрезах. Группировка позволяет объединять записи по полям-измерениям, агрегируя данные в полях-фактах для даль- нейшего анализа. Стандартные варианты агрегации: сумма, среднее, максимум, минимум, количество. Помимо стандартных вариантов агрегации можно еще рассчитать медиану, выбрать первый и последний эле- менты в группе. Медиана рассчитывается следующим образом: все строки, попавшие в группу, сортируются по факту, по которому рассчиты-

RkJQdWJsaXNoZXIy MTY0OTYy