Технологии интеллектуального анализа данных : учебное пособие
223 Как правило, данные характеризуются различной природой и измерены в различных шкалах. Можно выделить два основных ти- па данных – количественные и качественные (рис. 4.3). Рис. 4.3. Основные типы данных После определения типов данных выделяются признаки, наиболее важные в контексте данного исследования, наиболее ве- роятно входящие в искомую зависимость. Для этого, как правило, используются статистические методы, основанные на применении корреляционного анализа, позволяющего быстро, хотя и прибли- женно, оценить влияние одного параметра на другой. Для выявления взаимосвязи двух признаков используют два типа методов – параметрические (для количественных нормально распределенных признаков) и непараметрические (для количест- венных признаков независимо от вида распределения, а также для качественных признаков) [7]. Основными параметрическими методами анализа данных, измеренных в количественных шкалах, являются коэффициент корреляции Пирсона и модель простой линейной регрессии. К непараметрическим методам анализа относятся ранговые коэф- фициенты корреляции Спирмена и Кендалла, позволяющие оце- нить нелинейные монотонные связи в данных. Непрерывные Дискретные Номинальные Порядковые Бинарные Качественные Количественные Данные
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy