Технологии интеллектуального анализа данных : учебное пособие
33 нахождение и аппроксимация зависимостей, связывающих анализируемые параметры или события, а также поиск параметров, наиболее значимых в терминах конкретной задачи; поиск данных, существенно отклоняющихся от выявлен- ных закономерностей (анализ аномалий); прогнозирование развития объектов различной природы на основе хранящейся ретроспективной информации об их состоянии в прошлом. Кластерный анализ (также употребляются термины «класте- ризация», «самообучение», «обучение без учителя») – это метод выделения из множества элементов групп (кластеров) схожих меж- ду собой элементов. Предполагается, что элементы одного и того же кластера похожи, а элементы различных кластеров отличаются друг от друга. Как правило, число кластеров заранее не определя- ется. Кластерный анализ записей баз данных осуществляется на основе значений их количественных и качественных атрибутов. При этом делается попытка автоматически разнести имеющиеся записи по различным группам. Кластерный анализ применяют при решении большого числа задач. В социологии его используют для обработки результатов опросов общественного мнения, в медици- не – для выявления типичных клинических случаев, в маркетинге – для поиска родственных групп клиентов. Часто выделение класте- ров – отправная точка для других алгоритмов интеллектуального анализа данных. Применение этой процедуры позволяет во многих случаях перейти от обработки всего массива записей к анализу относитель- но небольшого числа кластеров. Системы интеллектуального анализа данных эффективно ис- пользуются для автоматического нахождения взаимосвязей и нели- нейных зависимостей в данных. Учет подобных зависимостей по-
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy