Технологии интеллектуального анализа данных : учебное пособие
224 В случае бинарных признаков применяют таблицы сопря- женности, в которых записываются наблюдаемые частоты совме- стных комбинаций значений признаков. При этом, предполагая ис- тинность гипотезы о независимости анализируемых признаков, со- ставляют таблицы ожидаемых частот. Если наблюдаемые и ожи- даемые частоты сильно различаются, то в этом случае говорят о зависимости бинарных признаков. Зависимость между количественными признаками принято называть корреляцией, а зависимость между качественными, на- пример, бинарными признаками – ассоциацией. Если вопросы выявления зависимости в однородных данных, относящихся к определенному типу, хорошо изучены, то определе- ние независимости признаков, измеренных в шкалах различных видов (например, бинарный и количественный), является достаточ- но сложной задачей. Методы анализа связи признаков становятся сложнее. В литературе для упрощения исследования предлагается пони- жать одну из шкал измерений до уровня другой, а затем использовать стандартную методику. При этом происходит некоторая потеря ин- формации, однако последующий анализ становится проще и ясней. Для приведения данных к единой шкале измерений (напри- мер, от нуля до единицы) можно воспользоваться процедурой нор- мировки по правилу: норм min max min i i x x x x x , где x i – i -е значение признака ( 1, i n , где n – количество значений); x min и x max – соответственно минимальное и максимальное зна- чение признака; норм i x – нормированное значение.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy