Технологии интеллектуального анализа данных : учебное пособие

141 основании набора, то, значит, правило Х  Y имеет поддержку, рав- ную поддержке набора F , который составляют X и Y : | | | | F X Y X Y F D Supp Supp D      . Очевидно, что правила, построенные на основании одного и того же набора, имеют одинаковую поддержку, например, под- держка: Supp если (вода, кокосы) то (орехи) = Supp {вода, кокосы, орехи} = 1/2;  достоверность (confidence) – показывает вероятность того, что из наличия в транзакции набора X следует наличие в ней набо- ра Y. Достоверностью правила Х => Y является отношение числа транзакций, содержащих наборы X и Y, к числу транзакций, содер- жащих набор X : | | | | X Y F X Y X Y X X Supp D Conf D Supp       . Очевидно, что чем больше достоверность, тем правило луч- ше, причем у правил, построенных на основании одного и того же набора, достоверность будет разная, например: Conf если (вода) то (орехи) = 2/3; Conf если (орехи) то (вода) = 2/3; Conf если (вода, кокосы) то (орехи) = 1; Conf если (вода) то (орехи, кокосы) = 2/3. К сожалению, достоверность не позволяет оценить полез- ность правила. Если процент наличия в транзакциях набора Y при условии наличия в них набора X меньше, чем процент безусловно- го наличия набора Y : X Y X y Y X Supp Conf Supp Supp     ,

RkJQdWJsaXNoZXIy MTY0OTYy