Технологии интеллектуального анализа данных : учебное пособие
85 тик: классификация, регрессия, поиск ассоциативных правил и кла- стеризация. Рассмотрим краткое их описание. Задача классификации сводится к определению класса объекта по его характеристикам. В данной задаче множество клас- сов, к которым может быть отнесен объект, заранее известно. Задача регрессии , подобно задаче классификации, позволя- ет определить по известным характеристикам объекта значение некоторого его параметра. В отличие от задачи классификации значением параметра является не конечное множество классов, а множество действительных чисел. При поиске ассоциативных правил целью является нахож- дение частых зависимостей (или ассоциаций) между объектами или событиями. Найденные зависимости представляются в виде правил и могут быть использованы как для лучшего понимания природы анализируемых данных, так и для предсказания появления событий. Задача кластеризации заключается в поиске независимых групп (кластеров) и их характеристик во всем множестве анализи- руемых данных. Решение этой задачи помогает лучше понять дан- ные. Кроме того, группировка однородных объектов позволяет со- кратить их число, а следовательно, и облегчить анализ. Перечисленные задачи по назначению делятся на описатель- ные и предсказательные. Описательные (descriptive) задачи уделяют внимание улуч- шению понимания анализируемых данных. Ключевой момент в таких моделях – легкость и прозрачность результатов для воспри- ятия человеком. Возможно, обнаруженные закономерности будут специфической чертой именно конкретных исследуемых данных и больше нигде не встретятся, но это все равно может быть полезно и потому должно быть известно. К такому виду задач относятся кла- стеризация и поиск ассоциативных правил.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy