Технологии интеллектуального анализа данных : учебное пособие

176  если значение р обычно интерпретируется либо как стати- стически значимый или незначимый результат, то ДИ, представ- ляющий интервал значений, на котором истинное изменение долж- но произойти, позволяет интерпретировать значение изменений на любом конце ДИ. По этим причинам ДИ предпочтительнее, чем р , хотя обычно при представлении результатов исследования желательно приво- дить и ту, и другую величину. Если признак определен как количественный, то задача ис- следователя заключается в том, чтобы установить, является ли его распределение нормальным (гауссовым). Статистическая гипотеза о соответствии распределения нормальному может быть проверена специальными статистическими методами. Это необходимо для того, чтобы выбрать наиболее адекватные и мощные методы стати- стического анализа данных. Проверка нормальности распределения признака важна еще и по другой причине. Известно, что нормальное распределение возни- кает в том случае, когда вариабельность значений этого признака обусловлена влиянием множества причин, каждая из которых вносит минимальный вклад. Для конкретного признака это означает его взаимосвязь со многими другими признаками, а не с одним-двумя. Статистическое моделирование – это построение математиче- ских моделей взаимодействия между собой двух признаков и более; его цель – прогнозирование значения одного признака по значениям других признаков. Статистическая модель не позволяет выявлять закономерности, но может лишь имитировать «поведение» одного признака при известном «поведении» других признаков. При использовании методов статистического моделирования необходимо учитывать следующие основные положения: 1) каждый метод статистического моделирования имеет оп- ределенные предположения в отношении распределений призна-