Технологии интеллектуального анализа данных : учебное пособие
286 Если поддержка имеет большое значение, то алгоритмы будут на- ходить правила, хорошо известные аналитикам или настолько оче- видные, что нет никакого смысла проводить такой анализ. С другой стороны, низкое значение поддержки ведет к генерации огромного количества правил, что требует существенных вычислительных ресурсов. Большинство интересных правил находится именно при низком значении порога поддержки, хотя слишком низкое значение поддержки ведет к генерации статистически необоснованных пра- вил. Ассоциативные правила с высокой поддержкой могут приме- няться для формализации хорошо известных правил, например, в автоматизированных системах для управления процессами или персоналом. Надо отметить, что понятия «высокая» и «низкая» поддержка или достоверность очень сильно зависят от предметной области. Например, в торговле 1 % вероятности совместного при- обретения хлеба и молока не значит ничего, в то время как вероят- ность в 1 % отказа двигателя самолета совершенно неприемлема, и такое правило становится чрезвычайно важным. Поиск ассоциативных правил совсем не тривиальная задача, как может показаться на первый взгляд. Одна из проблем – алго- ритмическая сложность при нахождении часто встречающих набо- ров элементов, так как с ростом числа элементов экспоненциально растет число потенциальных наборов элементов. Обычные ассоциативные правила – это правила, в которых как в условии, так и в следствии присутствуют только элементы транзакций, при вычислении которых используется только инфор- мация о том, присутствует ли элемент в транзакции или нет. Фак- тически все приведенные примеры относятся к обычным ассоциа- тивным правилам. В качестве примера рассмотрим таблицу транзакций (табл. 4.27).
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy