Технологии интеллектуального анализа данных : учебное пособие

172 ний стало обязательным требованием. Это обусловлено следую- щим: 1) доверительный интервал для какого-либо параметра по- зволяет наглядно представить спектр возможных значений этого параметра, которые могут быть рассчитаны по другим выборкам из той же генеральной совокупности; 2) доверительный интервал, помимо использования с целью оценки параметров описания выборки, может также использовать- ся для сравнения выборок; 3) при указании доверительного интервала нет необходимо- сти следить за видом распределения количественного признака, так как такое описание спектра популяционных значений параметра подходит как для нормально распределенных, так и распределен- ных по другим законам данных. В случае нормального распределе- ния ДИ для среднего значения симметричен относительно этого среднего значения, в других случаях – несимметричен относитель- но него. После определения типа данных необходимо выяснить, какие способы описания выборок и методы статистического анализа сле- дует применять. Если признак является качественным, то его рас- пределение следует описывать, например, с помощью вычисления абсолютных и относительных частот. Если же признак количест- венный, то возникает задача определения вида его распределения в зависимости от его типа – непрерывный или дискретный. На прак- тике важно бывает знать хотя бы то, подчиняется ли распределение непрерывного признака закону нормального (гауссова) распреде- ления или нет. Проверка статистических гипотез. Наиболее частые за- дачи статистических исследований, для решения которых оказы-

RkJQdWJsaXNoZXIy MTY0OTYy