Технологии интеллектуального анализа данных : учебное пособие
14 ство проданного товара, результаты экспериментов и т. п.). Факти- ческие данные могут быть представлены в виде числовых или кате- гориальных значений. На основании детальных данных могут быть получены агре- гированные (обобщенные) данные. Агрегирование происходит пу- тем суммирования числовых фактических данных по определен- ным измерениям. В зависимости от возможности агрегировать данные они подразделяются на следующие типы: аддитивные – числовые фактические данные, которые мо- гут быть просуммированы по всем измерениям; полуаддитивные – числовые фактические данные, кото- рые могут быть просуммированы только по определенным изме- рениям; неаддитивные – фактические данные, которые не могут быть просуммированы ни по одному измерению. Данные, поступающие из ОИД в ХД, перемещаемые внутри ХД и поступающие из ХД к аналитикам, образуют следующие ин- формационные потоки (см. рис. 1.4): входной поток (Inflow) – образуется данными, копируемы- ми из ОИД в ХД; поток обобщения (Upflow) – образуется агрегированием детальных данных и их сохранением в ХД; архивный поток (Downflow) – образуется перемещением детальных данных, количество обращений к которым снизилось; поток метаданных (MetaFlow) – образуется потоком ин- формации о данных в репозиторий данных; выходной поток (Outflow) – образуется данными, извле- каемыми пользователями; обратный поток (Feedback Flow) – образуется очищенными данными, записываемыми обратно в ОИД.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy