Технологии интеллектуального анализа данных : учебное пособие
61 ды; методы визуализации; методы кросс-табуляции; методы, осно- ванные на уравнениях. Логические методы, или методы логической индукции, включают: нечеткие запросы и анализы; символьные правила; де- ревья решений; генетические алгоритмы. Методы этой группы яв- ляются, пожалуй, наиболее интерпретируемыми – они оформляют найденные закономерности, в большинстве случаев, в достаточно прозрачном виде с точки зрения пользователя. Полученные прави- ла могут включать непрерывные и дискретные переменные. Следу- ет заметить, что деревья решений могут быть легко преобразованы в наборы символьных правил путем генерации одного правила по пути от корня дерева до его терминальной вершины. Деревья ре- шений и правила фактически являются разными способами реше- ния одной задачи и отличаются лишь по своим возможностям. Кроме того, реализация правил осуществляется более медленными алгоритмами, чем индукция деревьев решений. Методы кросс-табуляции: агенты, баесовские (доверитель- ные) сети, кросс-табличная визуализация. Последний метод не со- всем отвечает одному из свойств Data Mining – самостоятельному поиску закономерностей аналитической системой. Однако предос- тавление информации в виде кросс-таблиц обеспечивает реализа- цию основной задачи Data Mining – поиск шаблонов, поэтому этот метод можно также считать одним из методов Data Mining. Методы на основе уравнений выражают выявленные зако- номерности в виде математических выражений – уравнений. Следо- вательно, они могут работать лишь с численными переменными и переменные других типов должны быть закодированы соответст- вующим образом. Это несколько ограничивает применение методов данной группы, тем не менее они широко используются при реше- нии различных задач, особенно задач прогнозирования. Основные методы данной группы: статистические методы и нейронные сети.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy