Технологии интеллектуального анализа данных : учебное пособие
235 правление наибольшего разброса массива данных, т.е. перейдем в систему координат Х'-Y' . Теперь по оси X' дисперсия данных неве- лика и появляется возможность отбросить это направление, перей- дя к одномерному пространству (рис. 4.12). Рис. 4.12. Одномерное пространство наблюдений признаков В этом случае потери некоторой части информации могут компенсироваться удобством работы с данными меньшей размер- ности. Аналогичные действия выполняются в многомерном случае: система координат последовательно вращается таким образом, чтобы каждый следующий поворот минимизировал остаточный разброс массива данных. Выбор главных компонент в процессе факторного анализа может осуществляться полуавтоматически: пользователь задает уровень значимости (вклад в результат), который в сумме должны давать главные компоненты. В результирующем наборе остаются главные компоненты, расположенные в порядке убывания значи- мости, суммарный вклад которых не менее заданного пользовате- лем уровня. Факторный анализ широко используется в следующей ситуа- ции. В очень большом исходном наборе данных есть много полей, некоторые из которых взаимозависимы. На этом наборе данных требуется, к примеру, обучить нейронную сеть. Для снижения вре- мени, требуемого на обучение сети, и требований к объему обу- чающей выборки, с помощью факторного анализа осуществляют переход в новое пространство факторов меньшей размерности. Так как большая часть информативности исходных данных сохраняется в выбранных главных компонентах, то качество модели ухудшает- ся незначительно, зато намного сокращается время обучения сети. Y´
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy