Технологии интеллектуального анализа данных : учебное пособие

81  какова последовательность просмотра страниц.  какие группы пользователей можно выделить среди обще- го их числа на основе истории просмотра Web-узла. Web Usage Mining включает следующие составляющие:  предварительная обработка;  операционная идентификация;  инструменты обнаружения шаблонов;  инструменты анализа шаблонов. При использовании Web Mining перед разработчиками воз- никает две задачи: первая касается сбора данных, вторая – исполь- зования методов персонификации. В результате сбора некоторого объема персонифицированных ретроспективных данных о кон- кретном клиенте система накапливает определенные знания о нем и может рекомендовать ему, например, определенные наборы това- ров или услуг. На основе информации о всех посетителях сайта Web-система может выявить определенные группы посетителей и также рекомендовать им товары или же предлагать товары в рас- сылках. Text Mining Text Mining охватывает новые методы для выполнения се- мантического анализа текстов, информационного поиска и управления. Синонимом понятия Text Mining является KDT (Knowledge Discovering in Text – поиск или обнаружение знаний в тексте). В отличие от технологии Data Mining, которая преду- сматривает анализ упорядоченной в некие структуры информа- ции, технология Text Mining анализирует большие и сверхболь- шие массивы неструктурированной информации. Программы, реализующие эту задачу, должны некоторым образом опериро- вать естественным человеческим языком и при этом понимать семантику анализируемого текста. Один из методов, на котором