Технологии интеллектуального анализа данных : учебное пособие
242 Удалив строки с пустыми ячейками, получим таблицу с пол- ными записями (табл. 4.3). Таблица 4.3 Результат применения метода скользящего окна с полными записями Первый день месяца Объем продаж два месяца назад Объем продаж месяц назад Объем продаж в текущий месяц Объем продаж на следующий месяц 01.03.2004 1000 1160 1210 1130 01.04.2004 1160 1210 1130 1250 01.05.2004 1210 1130 1250 1300 Такую таблицу можно использовать при построении моде- лей, например, для прогнозирования. При этом на вход модели для ее обучения будут подаваться поля с текущим и двумя предыду- щими месяцами, а на выход – поле с объемом продаж на следую- щий месяц. Эту таблицу также можно использовать для вычисления обо- ротов за определенное количество месяцев, например, вычисляя разницу между столбцами с объемом продаж за текущий месяц и объемом продаж за предыдущий месяц. Преобразование даты. Преобразование даты служит для ана- лиза всевозможных показателей за определенный период (год, квартал, месяц, неделя, день, час, минута, секунда). Суть преобра- зования заключается в том, что на основе столбца с информацией о дате/времени формируются один или несколько столбцов, в кото- рых указывается, к какому заданному интервалу времени принад- лежит строка данных. Тип интервала задается аналитиком, исходя из того, что он хочет выделить из даты. Такая операция требуется, потому что очень часто интерес- ным для анализа является не сама дата, а ее производная. Напри- мер, для анализа посещаемости магазина интересен день недели, а для оценки загруженности касс – час.
Made with FlippingBook
RkJQdWJsaXNoZXIy MTY0OTYy