Технологии интеллектуального анализа данных : учебное пособие

128 3.3. Методы и алгоритмы решения задачи поиска ассоциативных правил Одной из наиболее распространенных задач анализа данных является определение часто встречающихся наборов объектов в большом множестве наборов. Опишем эту задачу в обобщенном виде. Для этого обозначим объекты, составляющие исследуемые наборы (itemsets), следующим множеством:   1 2 , ,..., ,..., j n I i i i i  , где i j – объекты, входящие в анализируемые наборы; п – общее количество объектов. В сфере торговли, например, такими объектами являются то- вары, представленные в прайс-листе (табл. 3.7). Таблица 3.7 Пример прайс-листа Идентификатор Наименование товара Цена 0 Шоколад 30.00 1 Чипсы 12.00 2 Кокосы 10.00 3 Вода 4.00 4 Пиво 14.00 5 Орехи 15.00 Они соответствуют следующему множеству объектов: I = {шоколад, чипсы, кокосы, вода, пиво, орехи}. Наборы объектов из множества I , хранящиеся в БД и подвер- гаемые анализу, называются транзакциями. Опишем транзакцию как подмножество множества I : T =   | j j i i I  . Такие транзакции в магазине соответствуют наборам това- ров, покупаемых потребителем и сохраняемых в БД в виде товар-