Технологии интеллектуального анализа данных : учебное пособие
285 Достоверность правила показывает, какова вероятность того, что из X следует Y . Правило X Y справедливо с достоверностью (confidence) с , если с % транзакций из D , содержащих X , также со- держат Y : conf ( X Y ) = supp ( X Y )/ supp ( X ). Пусть, например, 75 % транзакций, содержащих хлеб, также содержат молоко, а 3 % от общего числа всех транзакций содержат оба товара сразу. Здесь 75 % – достоверность (confidence) правила, 3 % – под- держка (support) или «Если 'Хлеб', то 'Молоко'» с вероятностью 75 %. Другими словами, целью анализа является установление сле- дующих зависимостей: если в транзакции встретился некоторый набор элементов X , то на основании этого можно сделать вывод о том, что другой набор элементов Y также должен появиться в этой транзакции. Установление таких зависимостей дает возможность находить очень простые и интуитивно понятные правила. Алгоритмы поиска ассоциативных правил предназначены для нахождения всех правил X Y . Причем поддержка и достоверность этих правил должны быть выше некоторых заранее определенных порогов, называемых, соответственно минимальной поддержкой (minsupport) и минимальной достоверностью (minconfidence). Ана- логично, поддержка и достоверность ограничиваются сверху поро- гами максимальной поддержки (maxsupport) и максимальной дос- товерности (maxconfidence). В результате получаются два окна, в которые должны попасть поддержка и достоверность правила, что- бы оно было предъявлено аналитику. Значения для параметров минимальная (максимальная) под- держка и минимальная (максимальная) достоверность выбираются таким образом, чтобы ограничить количество найденных правил.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy