Технологии интеллектуального анализа данных : учебное пособие

240 4.6. Алгоритмы трансформации данных Анализируемая информация, представленная в виде набора данных, имеет определенный формат. Под форматом данных под- разумевается отнесение их к определенному типу (целочисленные, строковые, даты), задание вида (дискретные или непрерывные) и т.п. Для анализа различных аспектов информации может потре- боваться преобразование ее формата или трансформация. Кроме преобразования форматов трансформация включает в себя измене- ние представления данных и другие операции, связанные с преоб- разованиями данных. Рассмотрим основные методы и алгоритмы трансформации данных. Скользящее окно. При решении некоторых задач, например, при прогнозировании временных рядов при помощи нейросети, требуется подавать на вход модели значения нескольких смежных отсчетов из исходного набора данных. Такой метод отбора данных называется скользящим окном (окно – поскольку выделяется толь- ко некоторый непрерывный участок данных, скользящее – по- скольку это окно «перемещается» по всему набору). При этом эф- фективность реализации заметно повышается, если не выбирать данные каждый раз из нескольких последовательных записей, а последовательно расположить данные, относящиеся к конкретной позиции окна, в одной записи. Значения в одном из полей записи будут относиться к теку- щему отсчету, а в других – смещены от текущего отсчета «в буду- щее» или «в прошлое». Таким образом, преобразование скользяще- го окна имеет два параметра: «глубина погружения» – количество «прошлых» отсчетов, попадающих в окно, и «горизонт прогнози- рования» – количество «будущих» отсчетов. Следует отметить, что для граничных (относительно начала и конца всей выборки) поло- жений окна будут формироваться неполные записи, т.е. записи,

RkJQdWJsaXNoZXIy MTY0OTYy