Технологии интеллектуального анализа данных : учебное пособие
70 Основным отличием задачи сиквенциального анализа от по- иска ассоциативных правил является установление отношения по- рядка между исследуемыми наборами. Данное отношение может быть определено разными способами. При анализе последователь- ности событий, происходящих во времени, объектами таких набо- ров являются события, а отношение порядка соответствует хроно- логии их появления. Сиквенциальный анализ широко используется, например в телекоммуникационных компаниях, для анализа данных об авариях на различных узлах сети. Информация о последовательности со- вершения аварий может помочь в обнаружении неполадок и пре- дупреждении новых аварий. Например, если известна последова- тельность сбоев: { e 5 , e 2 , e 7 , e 13 , e 9 , …}, где е , – сбой с кодом i , то на основании факта появления сбоя е 2 можно сделать вывод о скором появлении сбоя е 7 . Зная это, можно предпринять профилактические меры, устраняющие причины воз- никновения сбоя. Если дополнительно обладать и знаниями о вре- мени между сбоями, то можно предсказать не только факт его по- явления, но и время, что часто не менее важно. Задача кластеризации Задача кластеризации состоит в разделении исследуемого множества объектов на группы «похожих» объектов, называемых кластерами. Слово кластер английского происхождения (cluster), переводится как сгусток, пучок, группа. Родственные понятия, ис- пользуемые в литературе, – класс, таксон, сгущение. Часто реше- ние задачи разбиения множества элементов на кластеры называют кластерным анализом.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy