Технологии интеллектуального анализа данных : учебное пособие

47 Очевидно, что физически данные, представленные в много- мерном виде, хранятся в «плоских» файлах. При этом куб пред- ставляется в виде одной плоской таблицы, в которую построчно вписываются все комбинации членов всех измерений с соответст- вующими им значениями мер. Можно выделить следующие преимущества использования многомерных БД в OLAP-системах: - поиск и выборка данных осуществляются значительно бы- стрее, чем при многомерном концептуальном взгляде на реляцион- ную БД, так как многомерная база данных денормализована и со- держит заранее агрегированные показатели, обеспечивая оптими- зированный доступ к запрашиваемым ячейкам и не требуя допол- нительных преобразований при переходе от множества связанных таблиц к многомерной модели; - многомерные БД легко справляются с задачами включения в информационную модель разнообразных встроенных функций, тогда как объективно существующие ограничения языка SQL де- лают выполнение этих задач на основе реляционных БД достаточ- но сложным, а иногда и невозможным. С другой стороны, имеются также и существенные недос- татки: - за счет денормализации и предварительно выполненной аг- регации объем данных в многомерной БД, как правило, соответст- вует (по оценке Кодда) в 2,5...100 раз меньшему объему исходных детализированных данных; - в подавляющем большинстве случаев информационный гиперкуб является сильно разреженным, а поскольку данные хра- нятся в упорядоченном виде, неопределенные значения удается удалить только за счет выбора оптимального порядка сортировки, позволяющего организовать данные в максимально большие

RkJQdWJsaXNoZXIy MTY0OTYy