Технологии интеллектуального анализа данных : учебное пособие

14 ство проданного товара, результаты экспериментов и т. п.). Факти- ческие данные могут быть представлены в виде числовых или кате- гориальных значений. На основании детальных данных могут быть получены агре- гированные (обобщенные) данные. Агрегирование происходит пу- тем суммирования числовых фактических данных по определен- ным измерениям. В зависимости от возможности агрегировать данные они подразделяются на следующие типы:  аддитивные – числовые фактические данные, которые мо- гут быть просуммированы по всем измерениям;  полуаддитивные – числовые фактические данные, кото- рые могут быть просуммированы только по определенным изме- рениям;  неаддитивные – фактические данные, которые не могут быть просуммированы ни по одному измерению. Данные, поступающие из ОИД в ХД, перемещаемые внутри ХД и поступающие из ХД к аналитикам, образуют следующие ин- формационные потоки (см. рис. 1.4):  входной поток (Inflow) – образуется данными, копируемы- ми из ОИД в ХД;  поток обобщения (Upflow) – образуется агрегированием детальных данных и их сохранением в ХД;  архивный поток (Downflow) – образуется перемещением детальных данных, количество обращений к которым снизилось;  поток метаданных (MetaFlow) – образуется потоком ин- формации о данных в репозиторий данных;  выходной поток (Outflow) – образуется данными, извле- каемыми пользователями;  обратный поток (Feedback Flow) – образуется очищенными данными, записываемыми обратно в ОИД.

RkJQdWJsaXNoZXIy MTY0OTYy