Технологии интеллектуального анализа данных : учебное пособие

142 то это значит, что вероятность случайно угадать наличие в тран- закции набора Y больше, чем предсказать это с помощью правила Х => Y. Для исправления такой ситуации вводится мера – улучшение ;  улучшение (improvement) – показывает, полезнее ли прави- ло случайного угадывания. Улучшение правила является отноше- нием числа транзакций, содержащих наборы X и Y, к произведению количества транзакций, содержащих набор X , и количества тран- закций, содержащих набор Y : | | | || | * X Y F X Y X Y X Y X Y Supp D impr D D Supp Supp       . Например, impr если (вода, кокосы) то (орехи) = 0,5/(0,5*0,5) = 2. Если улучшение больше единицы, то это значит, что с помо- щью правила предсказать наличие набора Y вероятнее, чем случай- ное угадывание, если меньше единицы, то наоборот. В последнем случае можно использовать отрицающее прави- ло, т.е. правило, которое предсказывает отсутствие набора Y : X => не Y . У такого правила улучшение будет больше единицы, так как Supp не Y = 1– Supp Y . Таким образом, можно получить правило, которое предска- зывает результат лучше, чем случайным образом. Правда, на прак- тике такие правила малоприменимы. Например, правило: Если (вода, орехи) то не пиво малополезно, так как слабо выражает поведение покупателя. Данные оценки используются при генерации правил. Анали- тик при поиске ассоциативных правил задает минимальные значе- ния перечисленных величин. В результате те правила, которые не удовлетворяют этим условиям, отбрасываются и не включаются

RkJQdWJsaXNoZXIy MTY0OTYy