Технологии интеллектуального анализа данных : учебное пособие
9 В ХД, напротив, хранится историческая информация. С этой точки зрения, дублирование содержимого ХД данными ОИД оказывается весьма незначительным. В ХД хранится обобщенная информация, которая в ОИД от- сутствует. Во время загрузки в ХД данные очищаются (удаляется ненужная информация) и приводятся к единому формату. После такой обработки данные занимают гораздо меньший объем. Поскольку реализация ХД – очень трудоемкий и сложный процесс, разработчик неизбежно сталкивается со следующими проблемами: необходимость интеграции данных из неоднородных ис- точников в распределенной среде. ХД создаются для интегрирова- ния данных, которые могут поступать из разнородных ОИД, физи- чески размещающихся на разных компьютерах: БД, электронных архивов, справочников, статистических сборников и т.д. При соз- дании ХД приходится решать задачу построения системы, согласо- ванно функционирующей с неоднородными программными сред- ствами и решениями; потребность в эффективном хранении и обработке очень больших объемов информации. Свойство неизменности ХД предпо- лагает накопление в нем информации за долгий период времени, что должно поддерживаться постоянным ростом объемов дисковой па- мяти. Ориентация на выполнение аналитических запросов и связан- ная с этим денормализация данных приводят к нелинейному росту объемов памяти, занимаемой ХД при возрастании объема данных; необходимость наличия многоуровневых справочников ме- таданных. Метаданные необходимы пользователям СППР для по- нимания структуры информации, на основании которой принима- ется решение;
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy