Технологии интеллектуального анализа данных : учебное пособие
137 держка не отдельного объекта, а группы, в которую он входит, больше: g q j Supp I Supp i , где g j q i I . Это связано с тем, что при анализе групп подсчитываются не только транзакции, в которые входит отдельный объект, но и транзакции, содержащие все объекты анализируемой группы. Например, если поддержка Supp {кокосы, вода} = 2/4, то поддержка Supp {еда, напитки} = 2/4, так как объекты групп еда и напитки входят в транзакции с идентификаторами 0, 1 и 2. Использование иерархии позволяет определить связи, вхо- дящие в более высокие уровни иерархии, поскольку поддержка на- бора может увеличиваться, если подсчитывается вхождение груп- пы, а не ее объекта. Кроме поиска наборов, часто встречающихся в транзакциях, состоящих из объектов F ={ i | i I } или групп одного уровня иерархии 1 | g g g F I I I , можно рассматривать также смешанные наборы объектов и групп 1 , | , g g g F i I i I I . Это позволяет расширить анализ и получить дополнительные знания. При иерархическом построении объектов можно варьировать характер поиска, изменяя анализируемый уровень. Очевидно, что чем больше объектов в множестве I , тем больше объектов в тран- закциях Т и частых наборах. Это в свою очередь увеличивает время поиска и усложняет анализ результатов. Уменьшить или увеличить количество данных можно с помощью иерархического представле- ния анализируемых объектов. Перемещаясь вверх по иерархии, обобщаем данные и уменьшаем их количество, и наоборот. Недостатком обобщения объектов является меньшая полез- ность полученных знаний, так как в этом случае они относятся к
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy