Технологии интеллектуального анализа данных : учебное пособие

292 Для оценки качества моделей прогноза какой-либо непрерыв- ной величины, т.е. при решении задачи регрессии можно воспользо- ваться диаграммой рассеяния, на которой отображается отклонение прогнозного значения величины от ее истинного значения (рис. 4.26). Рис. 4.26. Пример диаграммы рассеяния: – SUMM+1; – SUMM+1_OUT; – эталон Слишком большое отклонение величины от ее истинного значения говорит о плохо построенной модели и необходимости увеличения обучающей выборки либо предобработки данных. На- пример, удалить аномалии, убрать шумы, изменить набор входных параметров. Слишком точное совпадение прогнозных значений на обучающей выборке с эталонными может говорить о переобучении модели, т.е. модель «запомнила» все примеры, используемые при ее обучении. В таком случае модель выдает отличные результаты именно на этих данных, но совершенно бесполезна на каких-либо других, например, на данных за другой промежуток времени. Это может произойти, если, например, для построения модели исполь- зовалась нейросеть с большим числом слоев. ROC-анализ ROC-анализ позволяет провести оценку качества модели- классификатора, сравнить прогностическую силу нескольких моде-

RkJQdWJsaXNoZXIy MTY0OTYy