Технологии интеллектуального анализа данных : учебное пособие

234 этом, когда влияние неизвестного фактора проявляется в несколь- ких измеряемых признаках, эти признаки могут обнаруживать тес- ную связь между собой (например, коррелированность). Поэтому общее число факторов может быть гораздо меньше числа измеряе- мых переменных, которое обычно выбирается исследователем в некоторой степени произвольно. Для обнаружения влияющих на измеряемые переменные факторов используются методы фактор- ного анализа. Типичным примером данных методов является метод глав- ных компонент, который сводится к выбору новой ортогональной системы координат в пространстве наблюдений. В качестве первой главной компоненты избирают направление, вдоль которого мас- сив данных имеет наибольший разброс. Выбор каждой главной по- следующей компоненты происходит так, чтобы разброс данных вдоль нее был максимальным и чтобы эта главная компонента была ортогональна другим главным компонентам, выбранным прежде. В результате получаем несколько главных компонент, каждая сле- дующая из которых несет все меньше информации из исходного набора. Следующим шагом является выбор наиболее информатив- ных главных компонент, которые будут использоваться в дальнейшем анализе. На рис. 4.11 изображено дву- мерное пространство наблюдений в осях X и Y , соответствующих двум измеряемым параметрам. Как видно, разброс данных ве- лик по обоим направлениям. Теперь повернем систему координат так, чтобы оси Y соответствовало на- Рис. 4.11. Двумерное пространство наблюдений признаков X X´ Y Y´

RkJQdWJsaXNoZXIy MTY0OTYy