Технологии интеллектуального анализа данных : учебное пособие

53 Главный недостаток ROLAP по сравнению с многомерными СУБД – меньшая производительность. Для обеспечения произво- дительности, сравнимой с MOLAP, реляционные системы требуют тщательной проработки схемы базы данных и настройки индексов, т.е. больших усилий со стороны администраторов БД. Только при использовании схем типа «звезда» производительность хорошо на- строенных реляционных систем может быть приближена к произ- водительности систем на основе многомерных баз данных. HOLAP . HOLAP-серверы используют гибридную архитек- туру, которая объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда данные более-менее плотные, серверы ROLAP показывают лучшие параметры в тех случаях, когда данные довольно разрежены. Серверы HOLAP при- меняют подход ROLAP для разреженных областей многомерного пространства и подход MOLAP – для плотных областей. Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их к соответствующим фрагментам данных, комбинируют резуль- таты, а затем предоставляют результат пользователю. 2.5. Понятие системы Data Mining Для обнаружения скрытых знаний в больших объемах дан- ных необходимо применять специальные методы автоматического анализа, при помощи которых приходится практически добывать знания из «завалов» информации. За этим направлением прочно закрепился термин добыча данных или Data Mining. Классическое определение этого термина дал в 1996 г. один из основателей этого направления Пятецкий-Шапиро. Data Mining – исследование и обнаружение «машиной» (ал- горитмами, средствами искусственного интеллекта) в сырых дан- ных скрытых знаний, которые ранее не были известны, нетриви-

RkJQdWJsaXNoZXIy MTY0OTYy