Технологии интеллектуального анализа данных : учебное пособие

147 Таблица 3.12 Результат работы алгоритма на шаге 2 № Набор Supp 1 {1,2} 0,25 2 {1,З} 0,5 3 {1,5} 0,25 4 {2,3} 0,5 5 {2,5} 0,75 6 {3,5} 0,5 На шаге 3 перейдем к созданию 3-элементных кандидатов и подсчету их поддержки. В результате получим множество С 3 (табл. 3.13). Таблица 3.13 Результат работы алгоритма на шаге 3 № Набор Supp 1 {2,3,5} 0,5 Данный набор удовлетворяет минимальной поддержке, сле- довательно: L 3 = {{2, 3, 5}}. Так как 4-элементные наборы создать не удастся, то резуль- татом работы алгоритма является множество: L = L 1  L 2  L 3 = = {{1},{2},{3},{5},{1, 3},{2, 3},{2, 5},{3, 5},{2, 3, 5}}. Для подсчета поддержки кандидатов нужно сравнить каждую транзакцию с каждым кандидатом. Очевидно, что количество кан- дидатов может быть очень большим и нужен эффективный способ подсчета. Гораздо быстрее и эффективнее использовать подход, основанный на хранении кандидатов в хэш-дереве. Внутренние уз- лы дерева содержат хэш-таблицы с указателями на потомков, а ли-

RkJQdWJsaXNoZXIy MTY0OTYy