Технологии интеллектуального анализа данных : учебное пособие
168 данные алгоритмы строятся не на основе взаимного распо- ложения точек, а лишь на отношении точек к центрам кластеров. Из перечисленных недостатков следует, что необходимо раз- рабатывать такой подход к кластеризации данных, который бы учитывал взаимосвязь между точками данных, а не взаимосвязь точек и центров кластеров (которых в общем случае может в прин- ципе не существовать). Такой подход может быть получен при по- мощи аппарата нечетких отношений, который еще не нашел широ- кого применения в алгоритмах кластеризации. 3.5. Статистические методы анализа данных Цель статистического анализа данных заключается в выявле- нии закономерностей в обучающей выборке и дальнейшей экстра- поляции полученных результатов на всю генеральную совокуп- ность (популяцию), из которой получена исследуемая выборка. Выявление закономерностей в выборке производится обычно пу- тем решения следующих основных задач: описание групп объектов исследования; сравнение групп; исследование взаимосвязей признаков. В статистике для решения этих задач существуют соответст- венно следующие основные подходы: статистическая оценка параметров распределения; проверка статистических гипотез; статистическое моделирование. Рассмотрим основные принципы этих подходов. Описательная статистика и статистическая оценка. Статисти- ческий анализ основан на следующем допущении: то, что верно для случайной выборки, верно и для генеральной совокупности (популяции), из которой эта выборка получена. Однако сделать ис-
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy