Технологии интеллектуального анализа данных : учебное пособие

289 однако это требует существенных вычислительных ресурсов. Од- ним из ограничений уменьшения порога минимальной поддержки является то, что слишком маленькая поддержка правила делает его статистически необоснованным; 2) уменьшение порога достоверности также приводит к уве- личению количества правил. Значение минимальной достоверности также не должно быть слишком маленьким, так как ценность пра- вила с достоверностью 5 % чаще всего настолько мала, что это и правилом считать нельзя; 3) правило со слишком большой поддержкой, с точки зрения статистики, представляет собой большую ценность, но, с практиче- ской точки зрения, это, скорее всего, означает то, что либо правило всем известно, либо товары, присутствующие в нем, являются ли- дерами продаж, откуда следует их низкая практическая ценность; 4) правило со слишком большой достоверностью практиче- ской ценности в контексте решаемой задачи не имеет, так как това- ры покупатель, скорее всего, уже купил. Если значение верхнего предела поддержки имеет слиш- ком большое значение, то в обнаруженных правилах основную часть будут составлять товары – лидеры продаж. При таком рас- кладе не представляется возможным уменьшить минимальный порог поддержки до того значения, при котором могут появлять- ся интересные правила. Причиной тому является просто огром- ное число правил и, как следствие, нехватка системных ресур- сов. Причем получаемые правила на 95 % содержат товары – ли- деры продаж. Варьируя верхним и нижним пределами поддержки, можно избавиться от очевидных и неинтересных закономерностей. Как следствие, правила, генерируемые алгоритмом, принимают при- ближенный к реальности вид.

RkJQdWJsaXNoZXIy MTY0OTYy