Технологии интеллектуального анализа данных : учебное пособие

143 в решение задачи. С этой точки зрения нельзя объединять разные правила, хотя и имеющие общую смысловую нагрузку. Если объекты имеют дополнительные атрибуты, которые влияют на состав объектов в транзакциях, а следовательно, и в на- борах, то они должны учитываться в генерируемых правилах. В этом случае условная часть правил будет содержать не только проверку наличия объекта в транзакции, но и более сложные опе- рации сравнения: больше, меньше, включает и др. Результирующая часть правил также может содержать утверждения относительно значений атрибутов. Например, если у товаров рассматривается цена, то правила могут иметь следующий вид: Если пиво.цена < 10 то чипсы.цена < 7 . Данное правило говорит о том, что если покупается пиво по цене меньше 10 руб., то, вероятно, будут куплены чипсы по цене меньше 7 руб. Алгоритм Apriori. Выявление частых наборов объектов – опе- рация, требующая большого количества вычислений, а следова- тельно, и времени. Алгоритм Apriori использует одно из свойств поддержки, гласящее: поддержка любого набора объектов не мо- жет превышать минимальной поддержки любого из его подмно- жеств: SuppF  SuppE , при E  F . Например, поддержка 3-объектного набора {пиво, вода, чип- сы} будет всегда меньше или равна поддержке 2-объектных набо- ров {пиво, вода}, {вода, чипсы}, {пиво, чипсы}. Это объясняется тем, что любая транзакция, содержащая {пиво, вода, чипсы}, со- держит также и наборы {пиво, вода}, {вода, чипсы}, {пиво, чип- сы}, причем обратное неверно.

RkJQdWJsaXNoZXIy MTY0OTYy