Модель хольта винтерса в excel - Word и Excel - помощь в работе с программами

Excel — это инструмент для проведения различных видов анализа, таких как прогнозы. В данном примере рассмотрим, как использовать Excel для составления прогноза с использованием модели Хольта-Уинтерса. Готовый файл с прогнозом можно скачать в конце примера.

Как сделать модель Хольта-Винтерса для расчета прогноза в Excel

Мы будем строить нашу модель прогноза по Хольту-Винтерсу на основе статистических данных, взятых из аэропорта. Используя модель, мы попытаемся предсказать, сколько пассажиров будет обслуживаться в иностранном регулируемом воздушном сообщении в 2016-2018 годах. В нашей таблице будут столбцы, указывающие: C(Yt) — количество обслуживаемых пассажиров, D(Ft) — оценка случайных вариаций модели, E(St) — оценка тренда для модели, F(Yt*) — истекший и реальный прогнозы, G(yt-yt*);H(|yt-yt*|);I((yt-yt*)2) — расчеты, необходимые для расчета показателей MAE, MSE, RMSE, MN — альфа и бета параметры для модели.

Составим прогноз с учетом всех правил модели Хольта-Винтерса используя формулы Excel и на основе полученных данных составим график для визуального анализа.

Метод прогноза по модели Хольта-Винтерса в Excel

Модель Хольта-Винтерса является одним из методов прогнозирования с использованием так называемых экспоненциальное сглаживание. Сглаживание состоит в создании взвешенного скользящего среднего, вес которого определяется по схеме — чем старше информация об изучаемом явлении, тем меньше значение для текущего прогноза. Чтобы построить модель, примите следующие предположения и формулы.

Модель рассчитывает прогнозы с истекшим сроком, то есть те, которые относятся к периоду, в котором фактическое значение уже было реализовано, и реальные прогнозы на период, который еще не произошел.

Первые значения F1 и S1 обычно:

Для оценки точности прогнозов модели, так называемой фактическая ошибка просроченных прогнозов с использованием показателей:

Средняя абсолютная ошибка — сообщает нам, насколько в среднем за период прогнозирования фактические значения прогнозируемой переменной будут отклоняться относительно абсолютного значения от прогнозов.

Средняя квадратическая ошибка — это средняя разница в квадрате отклонений между фактическими реализациями прогнозируемой переменной и прогноза.

где Yt* — прогнозы истекли.

Среднеквадратичная ошибка (RMSE — Root Mean Square Error) — измеряет, насколько отклонение реализации прогнозируемой переменной от рассчитанных прогнозов.

Созданную модель можно считать хорошей, если отношение RMSE / фактического прогнозирования составляет менее 10%. Однако на практике лучшим тестом для оценки эффективности модели будет сравнение прогнозов, которые она создает, с фактическими значениями.

Формулы для модели составления прогноза Хольта-Винтерса в Excel

Теперь, согласно сделанным в начале предположениям, приведем начальные значения для параметров F1 и S1. В нашем случае это будет y1 = F1 и y2-y1 = S1. Далее мы вводим альфа и бета параметры, временно принимая их значения равными 0,4 (позже мы будем оптимизировать данные с помощью инструмента «Поиск решения» Солвера).

На следующем шаге мы вычисляем Ft и St одновременно в соответствии с приведенными выше формулами, перетаскивая формулы вниз.

Перейдем к столбцу F, в котором с помощью формул рассчитываем, что для 1998-2015 годов прогнозы истекли, а для 2016-2018 годов — реальные прогнозы.

Мы заполняем столбцы GI, которые в данный момент будут использоваться для расчета фактической ошибки прогнозов с истекшим сроком (для получения абсолютного значения в столбце H мы можем использовать функцию Excel =ABS()).

Затем, используя функцию =СРЗНАЧ() и =КОРЕНЬ(), мы вычисляем вышеуказанные индикаторы ошибок MAE, MSE и RMSE.

Когда мы уже рассчитали показатели, мы можем приступить к оптимизации альфа- и бета-параметров, чтобы индекс MAE был как можно меньше. Для этого мы будем использовать аналитический инструмент в Excel «Поиск решения», доступный на вкладке «ДАННЫЕ» в группе «Анализ». Параметры поиска решения устанавливаются так, чтобы минимизировать индекс MAE, изменяя ячейки, помеченные как альфа и бета, закрытые в интервале [0-1].

После нажатия кнопки «Найти решение» и сохранения полученных результатов параметры альфа- и бета-сглаживания должны быть a = 1 и b = 0.228657122399511. На этом этапе мы можем предварительно проверить, может ли наша модель использоваться в качестве эффективного инструмента прогнозирования. Для этой цели мы рассчитываем коэффициент приемлемости прогноза, определенный формулой RMSE / фактическим прогнозом для последующих периодов T16-T18. В нашем случае на 2016 год это 5%, поэтому прогноз можно считать достоверным. Наконец, стоит визуализировать весь анализ на графике, принимая реальные значения и прогнозы в виде серии данных.

Скачать пример прогноза по модели Хольта-Винтерса в Excel

Когда у нас есть прогноз, ничего не остается делать, кроме как следить за новыми данными, чтобы проверить, имеет ли смысл использовать модель. Из того, что можно найти на одном из информационных порталов о авиаперелетах данной компании, общее количество ее обслуженных пассажиров в 2017 году составило более 4,6 млн. человек. Поэтому высокая вероятность, что прогнозируемые нами значения работают на практике.

Источник

1. В настройках прогноза в разделе «Настройки прогноза» выбираем «Прогноз по методу экспоненциального сглаживания»:

или на панели Excel «Модель Экспоненциального сглаживания» (можно выбрать если не нажата кнопка «Автоматический выбор модели»):

2. Выбираем, какой у нас временной ряд (дневной, месячный, квартальный или введите количество периодов в цикле):

3. Задаем, на сколько периодов рассчитываем прогноз:

4. Для автоматического подбора модели и коэффициентов сглаживания ставим галочки «Автоматический выбор модели». Аналогично с коэффициентами сглаживания.

5. Для ручной настройки параметров модели экспоненциального сглаживания снимаем галочки «Автоматический выбор модели» и»Автоматический подбор коэффициентов».

Настраиваем параметры модели в области настроек «Параметры для модели экспоненциального сглаживания»:

Выбираем одну из трех моделей экспоненциального сглаживания (простое, Хольта или Хольта-Винтерса);

Вводим коэффициенты сглаживания:

6. Для того, чтобы вывести коэффициенты сглаживания для каждого временного ряда, вы можете поставить галочку «уравнение тренда» в области «На лист с прогнозом».

7. Сохраняем настройки, открываем любой файл Excel с данными, на основании которых хотим сделать прогноз, например, как этот файл продажи по месяцам.

Важно, чтобы данные не содержали промежуточных итогов по столбцам, иначе они попадут в расчет прогноза.

8. Устанавливаем курсор мыши в ячейку, с которой хотите, чтобы программа рассчитала прогноз (ячейку выделил жёлтым цветом).

9. Нажимаем кнопку с «Рассчитать».

Готово! Прогноз по методу экспоненциального сглаживания рассчитан.

Важно! Программа начнет расчет прогноза с той ячейки с данными, в которую вы установите курсор. Например, если вы установите курсор не в январь, который выделен желтым во вложенном файле, а установите на март, то программа сделает расчет начиная с марта.

Источник

Составляющие временного ряда

При анализе временного ряда выделяют три составляющие: тренд, сезонность и шум. Тренд — это общая тенденция, сезонность,
как следует из названия — влияния периодичности (день недели, время года и т.д.) и, наконец, шум — это случайные факторы.

Что бы понять отличие этих трёх величин, смоделируем функцию расстояния от земли до луны. Известно, что в среднем луна
каждый год отдаляется на 4 см — это тренд, в течение дня луна совершает оборот вокруг земли и расстояние колеблется
от ~362600 км до ~405400 км — это сезонность. Шум — это «случайные» факторы, например, влияние других планет.
Если мы изобразим сумму этих трёх графиков, то мы получим временной ряд — функцию, показывающую изменение расстояния от земли
до луны во времени.

Тренд. Методы сглаживания

Методы сглаживания необходимы для удаления шума из временного ряда. Существуют различные способы сглаживания, основные — это
метод скользящей средней и метод экспоненциального сглаживания.

Метод скользящей средней

Идея метода скользящего среднего заключается в смещении точки графика на среднее значение некоторого интервала.
В качестве интервала берут нечётное количество участков, например, три — предыдущий, текущий и следующий периоды,
находится среднее и принимается в качестве сглаженного значения:

S_i = Σ^k_j=-k(x_i+j)/(2k+1)

У данного метода есть проблема: случайное высокое или низкое значение сильно влияют на скользящую линию. В качестве
решения были введены веса. Для распределение веса используют оконные функции, основные оконные функции — это окно Дирихле
(прямоугольная функция), В-сплайны, полиномы, синусоидальные и косинусоидальные:

График 4. Окно Ганна для n=5 (косинусоидальное окно)

График 5. Синусоидальное окно для n=5

Минусы использования скользящей средней — это сложность вычислений и некорректные данные на концах графика.

Исходные данные	Скользящая средняя	Взвешенная скользящая средняя (синусоидальное окно, n=5)	Взвешенная скользящая средняя (окно Ганна, n=5)
800	831	283	0
861	917	470	400
1090	1018	549	431
1322	1063	658	545
980	1179	696	661
1325	1299	713	490
1568	1191	782	663
891	1314	784	784
1472	1401	760	446
1673	1372	821	736
1450	1349	935	837
800	1673	800	725
2768	1815	946	400
2243	1891	1230	1384
1752	2157	1360	1122
1865	2105	1164	876
2560	2348	1229	933
3214	2582	1538	1280
2690	3043	1732	1607
3707	3204	2528	1345
Таблица 1. Сглаживание методом скользящей средней

График 6. Сглаживание скользящей средней. Красный — исходные данные, персиковый — скользящая средняя,
жёлтая и охра — скользящая средняя, взвешенная синусоидальным окном с n=7 и n=3 соответственно

Как видно из графика, увеличение n выдаёт более плавную функцию, таким образом нивелируя более мелкие колебания во временном ряду.
Обратите внимание, что при сглаживании не имеет значения, совпадает график среднего с графиком данных или нет,
целью является построение правильной формы.

Метод экспоненциального сглаживания

Метод экспоненциального сглаживания получил своё название потому, что в сглаженной функции экспоненциально убывает влияние предыдущего периода
с неким коэффициентом чувствительности α. Сглаженное значение находится как разница между предыдущим действительным значением и
рассчитанным значением:

D’_t = α·D_t-1 + (1-α)·D’_t-1

Коэффициент чувствительности, α, выбирается между 0 и 1, в качестве базиса используют значение 0,3. Если есть достаточная выборка,
то коэффициент подбирается путём оптимизации.

Исходные данные	Экспоненциальное сглаживание, α=0,1	Экспоненциальное сглаживание, α=0,6
800	800	800
861	-640	160
1090	662	453
1322	-487	473
980	571	604
1325	-416	346
1568	507	657
891	-300	678
1472	359	263
1673	-176	778
1450	326	693
800	-148	593
2768	213	243
2243	85	1564
1752	148	720
1865	42	763
2560	149	814
3214	122	1210
2690	212	1444
3707	78	1036
Таблица 2. Экспоненциальное сглаживание

График 7. Экспоненциальное сглаживание с α=0,1 (персиковая линия) и α=0,6 (жёлтая линия)

Методы прогнозирования

Методы прогнозирования основываются на выявлении тенденции во временном ряду и последующем использовании найденного значения
для предсказания будущих значений. В методах прогнозирования выделяют тренд и сезонность, в общем случае, все типы сезонности могут
быть найдены последовательными итерациями. Например, при анализе данных за год, можно выделить сезонность времени года, а в оставшемся
тренде найти сезонность по дням недели и так далее.

Двойное экспоненциальное сглаживание

Двойное экспоненциальное сглаживание выдаёт сглаженное значение уровня и тенденции.

Внимание! Может возникнуть путаница, метод Хольт-Винтерса отличается терминами: тренд, сезонность и шум
соответственно называются уровень, тренд и сезонность.

Smooth — сглаживание, сглаженный уровень на период τ, s_τ, зависит от значения уровня на текущий период (D_τ),
тренда за предыдущий период (t_τ-1) и рассчитанного сглаженного значения на предыдущий период (s_τ-1):
s_τ = αD_τ + (1 — α)(s_τ-1 + t_τ-1)

Trend — тенденция, тренд на период τ, t_τ, зависит от рассчитанного сглаженного значения за предыдущий и текущий периоды
(s_τ и s_τ-1) и от предыдущей тенденции:
t_τ = β(s_τ-s_τ-1) + (1-β)t_τ-1

Рассчитанные по данным формулам уровень и тренд могут быть использованы в прогнозировании:
D’_τ+h = s_τ + h·t_τ

При расчёте, значения s и t для первого периода назначают s₁ = D₁ и t=0

График 8. Данные (персиковая линия), экспоненциальное сглаживание — уровень (жёлтая линия), тренд
(линия цвета охры) и прогноз (чёрная линия) методом экспоненциального сглаживания

Метод Хольт-Винтерса

Метод Хольт-Винтерса включает в себя сезонную составляющую, т.е. периодичность. Существуют две разновидности метода —
мультипликативный и аддитивный. В отличие от двойного экспоненциального сглаживания, метод Хольт-Винтерса изучает также
влияние периодичности.

Общая идея нахождения значений сглаженного уровня, тренда и периодичности заключается в следующем: сглаженный уровень (s — smooth, иногда используют l — level)
— это базовый уровень значений, тренд (t — trend) — это показатель скорости роста, разница между сглаженными значениями текущего и предыдущего периода.
Для изучения периодичности (p — period), мы разбиваем данные на периоды размером k и выделяем влияние каждого элемента (1,2,…,k) периода на
сглаженный уровень.

Для более точных расчётов вводится показатель обратной связи.

В общем понимании, обратная связь — это влияние предыдущих значений
на новые: например, когда Вы начинаете говорить, Вы регулируете громкость своего голоса в зависимости от того, что слышат Ваши уши —
это и есть обратная связь.

Для начала расчётов, значения s, t и k, в самом простом виде, могут быть выбраны как s_τ = D_τ, t = 0, p = 0.

k — длина выбранного периода:
s_τ = α(D_τ — p_τ-k) + (1 — α)(s_τ-1 + t_τ-1)

С поправкой на предыдущие значения t_τ-k (обратная связь)
t_τ = β(s_τ-s_τ-1) + (1-β)t_τ-1

С поправкой на предыдущие значения p_τ-k (обратная связь)
p_τ = γ(D_τ — s_τ) + (1-γ)p_τ-k

Для прогнозирования используется следующая формула:

x_τ+h = D_τ + ht_τ + p_τ-k+h

Мультипликативный метод Хольт-Винтерса

Мультипликативный метод отличается от аддитивного тем, что параметры, влияющие на периодичность и сглаженный уровень
рассчитываются отношением:

p_τ = γ(D_τ/s_τ) + (1-γ)p_τ-k
s_τ = α(D_τ/p_τ-k) + (1 — α)(s_τ-1 + t_τ-1)
t_τ = β(s_τ-s_τ-1) + (1-β)t_τ-1

Для прогнозирования используется следующая формула:

x_τ+h = (D_τ + ht_τ)p_τ-k+h

Метод Хольт-Винтерса в excel

Таблица для скачивания в форматах ods и
xls.

Качество прогнозирования

Проверка качества прогнозирования возможна в случае наличия достаточной выборки и является важной проверкой на достоверность
прогноза, для проверки и оптимизации значений α, β и γ необходимо построить прогноз на существующие данные,
например, если у нас в наличии данные за пять лет и мы хотим предсказать следующий год, то необходимо построить модель на первых
четырёх годах, проверить и оптимизировать коэффициенты для минимизации ошибки между прогнозом и данными на 5й год. После оптимизации
модель может быть перестроена с учётом последнего периода для повышения точности, далее следует построение прогноза.

Методы оптимизации будут описаны в отдельной статье, ниже представлен пример прогнозирования методом Хольт Винтерса.

График 9. Данные о посещаемости сайта за четыре недели

#	Данные	s	t	p	s	t	p
1	93	93	0	0	93	0	0
2	91	92	-0.1	-0.5	92	-0.1	0.99
3	72	84	-0.89	-6	84	-0.89	0.93
4	75	80	-1.2	-2.5	80	-1.2	0.97
5	75	77	-1.38	-1	77	-1.38	0.99
6	57	68	-2.14	-5.5	68	-2.14	0.92
7	66	66	-2.13	0	66	-2.13	1
8	123	88	0.28	17.5	38	-4.72	1.62
9	85	87	0.15	-1.25	54	-2.65	1.28
10	85	89	0.34	-5	67	-1.09	1.1
11	91	91	0.51	-1.25	77	0.02	1.08
12	102	96	0.96	2.5	87	1.02	1.08
13	73	90	0.26	-11.25	85	0.72	0.89
14	60	78	-0.97	-9	75	-0.35	0.9
15	99	79	-0.77	18.75	69	-0.92	1.53
16	108	91	0.51	7.88	75	-0.23	1.36
17	98	96	0.96	-1.5	80	0.29	1.16
18	104	100	1.26	1.38	87	0.96	1.14
19	83	93	0.43	-3.75	84	0.56	1.03
20	68	88	-0.11	-15.63	81	0.2	0.86
21	62	81	-0.8	-14	76	-0.32	0.86
22	59	64	-2.42	6.88	61	-1.79	1.25
23	80	66	-1.98	10.94	59	-1.81	1.36
24	121	87	0.32	16.25	76	0.07	1.38
25	112	97	1.29	8.19	85	0.96	1.23
26	85	94	0.86	-6.38	85	0.86	1.02
27	106	106	1.97	-7.82	101	2.37	0.95
28	82	103	1.47	-17.5	100	2.03	0.84

График 9. Пример предсказания посещаемости сайта на основе данных за четыре недели. Жёлтая линия — исходные данные, красная — прогноз на пятую
неделю на основе первых четырёх. Закрашена линия сглаженного уровня при α=0.4, β=0.1, γ=0.5

Источник

Пункт шестой — «Построение прогноза продаж: основные методы прогнозирования»

Наконец-то мы подобрались к самому основному шагу нашей карты данных — «Построение прогноза продаж». Здесь я вкратце расскажу, какие методы прогнозирования наиболее распространены и популярны и приведу формулы их использования. А в следующей части данной статьи, я расскажу об обработке получившегося прогноза: наложении сезонности, округлении, учете промо и так далее.

Напомню, что до этого мы проделали довольно большой путь: подготовили корректную историю продаж, очищенную от нестабильных показателей, рассчитали коэффициенты сезонности и промо-объемы будущих периодов и определились с элементами графического интерфейса (GUI) нашего будущего инструмента прогнозирования. А теперь, мы будем рассматривать методы прогнозирования и строить сам прогноз.

Классификация методов прогнозирования.
Метод линейной регрессии.
Полиномиальный прогноз.
Модель на основе экспоненциального сглаживания
Модель на основе экспоненциального сглаживания с учетом тренда (Метод Хольта).
Модель на основе экспоненциального сглаживания с учетом тренда и мультипликативной сезонности (Метод Хольта-Винтерса).
Модель на основе экспоненциального сглаживания с учетом тренда и аддитивной сезонности (Метод Тейла-Вейджа).
Построение прогноза основанное на свойствах.
Методы прогнозирования: итоги и полезные ссылки.

Классификация методов прогнозирования.

Методы прогнозирования делятся на две группы или класса: интуитивные (субъективные или качественные) и формализованные (объективные или количественные). Интуитивные методы прогнозирования — это такие методы, основой которых НЕ являются сухие расчеты, математика и статистика. Они, в первую очередь, основаны на оценках группы экспертов и предназначены для прогнозирования объемов новой позиции, у которой нет истории продаж. Либо для прогнозирования объемов позиции, история продаж которой настолько нестабильна, что невозможно подобрать под нее адекватную математическую модель. В пример можно привести такие методы, как «Метод Дельфи», «Мозговой штурм», «Опрос/анкетирование» и так далее, но в данной статье данные методы прогнозирования рассмотрены не будут.

Здесь будут рассмотрены следующие формализованные методы прогнозирования:

Линейная регрессия
Полиномиальный прогноз
Экспоненциальное сглаживание
Модель Хольта
Модель Хольта-Винтерса
Модель Тейла-Вейджа

Немного расскажу про каждый из них, а также затрону метод «прогнозирования по свойствам». А в конце статьи, помимо готового примера в Excel с формулами расчета, добавлю ссылки на некоторые источники информации о методах прогнозирования, может кому-то будет полезно.

Методы прогнозирования: метод линейной регрессии.

Построение прогноза с помощью метода линейной регрессии — один из наиболее простых, часто-встречающихся и распространенных (если рассматривать Excel) методов прогнозирования. Часто встречается он как раз из-за того, что в Excel его очень легко применить — достаточно воспользоваться функцией ЛИНЕЙН, ПРЕДСКАЗ или ТЕНДЕНЦИЯ, где исходными данными будут являться номера периодов и соответствующие им объемы продаж.

Для нахождения прогноза на период x, мы воспользуемся уравнением y=k*x+b, где k — угловой коэффициент, который находится с помощью метода наименьших квадратов (на основании предыдущих периодов x и соответствующих значений y), а b — это точка, в которой наш график пересекается с осью y. Данное уравнение описывает линию, которая называется линия тренда, которая показывает динамику продаж и прогнозы на последующие периоды.

На гистограмме ниже изображены столбцы с объемами продаж для соответствующего периода (номера недель по оси X), пунктирная линия, которая как раз является линией тренда и столбец c предсказанным значением (соответствует «продолжению» линии тренда):

Данный метод один из самых простейших, и чаще всего используется для прогнозирования более-менее стабильных и регулярных продаж, однако при максимально аккуратном «сглаживании» промо-объемов, он подойдет и для нестабильных рядов. Важно отметить, что если история продаж у нас не очень большая (менее 4-5 периодов), данный метод прогнозирования не рекомендуется к использованию.

Также важно, что если мы хотим добавить к прогнозному значению коэффициент сезонности, то для начала, перед расчетом прогнозного значения, историю продаж необходимо «выровнять», то есть очистить от сезонных колебаний. А уже потом считать прогноз и накладывать сезонность.

Хочу отметить, что в моем опыте работы данный метод прогнозирования в совокупности с корректным сглаживанием числового ряда, а также с корректными значениями планируемых промо-объемов, которые мне предоставлял отдел трейд-маркетинга, достигал достаточно высокой точности прогнозирования (выше 80%).

Методы прогнозирования: полиномиальный прогноз.

Построение прогноза с помощью полинома немного похоже на построение прогноза с помощью предыдущего метода. Здесь, для нахождения прогноза на последующие периоды вместо линейного уравнение, мы используем полином третьей степени вида y = a*x³+b*x²+c*x+d или полином второй степени вида y = a*x²+b*x+c, где коэффициенты a,b,c,d постоянны и находятся с помощью различных методов решения систем линейных уравнений, на основании предыдущих периодов x и соответствующим им объемов продаж y.

Если степень полинома будет выше третьей — линия, которой описывается наш числовой ряд будет максимально приближена к реальным значениям, но при этом будет не очень пригодна для построения прогноза (особенно, если строите прогноз сразу на несколько периодов). Как раз на примере ниже это очень заметно:

Полином пятой степени дает неудовлетворительные результаты в прогнозе.

Здесь используется полином пятой степени. Да, линия почти совпадает с фактическим значениям, но при этом даже невооруженным глазом видно, что прогноз на 31 и 32-ую неделю крайне неадекватный. Поэтому использовать полиномы выше третьей степени не рекомендуется.

Методы прогнозирования: модель на основе экспоненциального сглаживания.

Первоначально, модель экспоненциального сглаживания использовалась для сглаживания числового ряда. Однако, спустя какое-то время, данную модель немного видоизменили и приспособили для краткосрочного прогнозирования. Модель приемлема для нахождения прогноза только на 1 период вперед.

Для нахождения прогноза Y̅ на период t+1, используется следующая формула:

где yt — значение факта на период t, Y̅t — сглаженное значение на период t, а α — коэффициент или параметр сглаживания, который принимает значение 0<α<1.

При применении данной модели все сводится к выбору оптимального значения α. Следует отметить, что чем меньше значение α, тем больше модель учитывает фактические показатели почти всех прошедших периодов. Если же значение близится к единице, то на модель будет оказывать наибольшее влияние только несколько последних периодов, а сам числовой ряд будет наименее сглажен.

Единого метода определения α не существует, но для его нахождения можно выбрать следующие варианты:

В некоторых источниках рекомендуют использовать значение 0,2<α<0,3, поэтому просто предлагается оставить параметр сглаживания примерно в этих рамках.
Использовать формулу α = 2/(n-1), где n — количество периодов для экспоненциального сглаживания. Например, грубо говоря, если n=8, то модель будет учитывать значения последних восьми периодов в числовом ряду, и α будет равен 0,25.

Также, возникает проблема нахождения Y̅1: для его расчета необходимо предыдущее значение факта y на период t = 0, а у нас такого, естественно, нет. Поэтому, за Y̅1 можно принять значение y1.

Гистограмма с линией экспоненциального сглаживания по которой строится прогноз выглядит так (α=0,4):

Данный метод неплохой, но он не учитывает тренд продукции и сезонные колебания (поэтому первоначально числовой ряд нужно очистить от сезонности, как и в линейной регрессии), то есть лучше всего подходит для стабильных числовых рядов. Плюс ко всему, как я уже говорил, подходит для построения прогноза только на 1 период вперед. Для числового ряда с учетом тренда можно использовать улучшенную модель экспоненциального сглаживания (метод Хольта), а если еще необходимо учесть сезонность, то можно использовать Метод Хольта-Винтерса или Метод Тейла-Вейджа, о которых я напишу далее.

Методы прогнозирования: модель на основе экспоненциального сглаживания с учетом тренда (Метод Хольта).

Данная модель — усовершенствованная версия модели экспоненциального сглаживания с учетом тренда продаж.

Формула нахождения прогноза Y̅ на период t+d следующая:

где d — порядковый номер периода, на который мы делаем прогноз (то есть если числовой ряд состоит из 10 периодов, а прогноз мы делаем на 11, то d =1), а At и Bt — адаптивные переменные: A — экспоненциально-сглаженное фактическое значение , а B — значение тренда. Находятся данные переменные по следующим формулам:

И как в случае с обычным экспоненциальным сглаживанием, здесь тоже есть параметры, но их уже два: α1 и α2. И оба они принимают значения ∈(0,1). Подбирать эти параметры нужно так, чтобы прогнозы, построенные на уже имеющиеся периоды с фактическими значениями, с помощью полученной модели, давали наименьшую ошибку прогноза (во многих источниках рекомендуют использовать RMSE или MAPE). Напомню, для нахождения RMSE используется следующая формула:

Для нахождения A1 должно использоваться A0, но так как его не существует, мы, опять же, как и в случае с обычным экспоненциальным сглаживанием, вместо него используем фактическое значение y1, а вместо B1 используем 0.

Методы прогнозирования: модель на основе экспоненциального сглаживания с учетом тренда и мультипликативной сезонности (Метод Хольта-Винтерса).

Данная модель — тоже усовершенствованная версия модели экспоненциального сглаживания, только здесь помимо тренда, добавлена еще и мультипликативная сезонность. Подходит модель для работы с числовыми рядами, в которых присутствует ярко-выраженная сезонность или цикличность.

Формула расчета прогноза Y̅ на период t+d следующая:

где d — порядковый номер прогнозируемого периода (как и в предыдущем примере), L — это количество периодов в одном цикле (для месячного прогнозирования — 12, для квартального — 4, для ежедневного — 7). At и Bt — адаптивные переменные: A — экспоненциально-сглаженное фактическое значение, а B — значение тренда. А C с большим индексом «t+(d mod L) — L» — значение сезонности в процентах. Индекс переменной C может немного смутить, но на самом деле все проще, чем кажется: просто используем C из прошлого цикла соответствующего периода (для прогноза на март используем коэффициент сезонности марта прошлого цикла).

Сами переменные A,B и C рассчитываются по следующим формулам:

При использовании Метода Хольта-Винтерса рассчитывать коэффициенты сезонности перед построением не нужно, их расчет включен в формулу. Однако очищать числовой ряд от неадекватных значений все так же необходимо. Также, стоит отметить, что для корректной «работы» данной модели, история продаж должна содержать как минимум несколько циклов для корректного расчета сезонности (для месячного прогнозирования, необходима история продаж как минимум за 2-3 последних года).

Особенности расчета начальных переменных:

Для A1 можно использовать y1
Для B1 можно использовать 0
В первом цикле при расчете A мы должны ссылаться на C прошлых циклов, но так как их нет, вместо C можно использовать 1 (то есть, пренебречь сезонностью)
А для расчета сезонностей самого первого цикла(!) для каждого периода можно использовать формулу Ct=yt/At

Параметры α1,α2,α3 ∈(0,1), как и в предыдущей модели, подбираются путем минимизации ошибки прогноза (RMSE или MAPE).

Методы прогнозирования: модель на основе экспоненциального сглаживания с учетом тренда и аддитивной сезонности (Метод Тейла-Вейджа).

Данная модель также разработана на основе экспоненциального сглаживания, в которую добавлен тренд и сезонность, но теперь не мультипликативная, а аддитивная. Особенности здесь такие же, как и в методе Хольта-Винтерса. Основное отличие в том, что здесь сезонность является не коэффициентом, на который мы умножаем полученный прогноз, а целым числом, которое мы прибавляем или вычитаем из прогноза.

Формула расчета прогноза Y̅ на период t+d следующая:

Сами переменные A,B и C рассчитываются по следующим формулам:

Особенности расчета начальных переменных:

Для A1 можно использовать y1
Для B1 можно использовать 0
В первом цикле при расчете A мы должны ссылаться на C прошлых циклов, но так как их нет, вместо C можно использовать 0 (то есть пренебречь сезонностью)
А для расчета сезонностей самого первого цикла(!) для каждого периода можно использовать формулу Ct=yt-At

Параметры α1,α2,α3 ∈(0,1), как и в предыдущей модели, подбираются путем минимизации ошибки прогноза (RMSE или MAPE).

Методы прогнозирования: построение прогноза основанное на свойствах.

Данный способ довольно интересный, чаще всего используется для определения спроса какого-либо нового продукта. Его нельзя полноценно отнести к формализованному методу, но и интуитивным назвать его тоже нельзя.

Рассмотрим его суть на примере телевизора. Предположим, что этот телевизор — новинка на рынке и необходимо рассчитать его прогноз продаж. Для начала, мы рассматриваем свойства данного телевизора (его функции и характеристики), например такие:

Диагональ экрана
Фирма-изготовитель
Разрешение экрана
Наличие Smart-TV
Возможность подключения USB
Частота экрана
Габариты
Возможность крепления на стену
Цвет
Частота обновления экрана
И так далее..

Далее, мы просматриваем статистику продаж других телевизоров и смотрим, как часто покупался какой-либо другой телевизор с тем или иным перечисленным свойством. И на основе всех этих данных, составляем некое уравнение, которое учтет частоту приобретения телевизора с каждым свойством по отдельности. И с помощью полученного уравнения рассчитаем примерный прогноз продаж нашей новинки.

Метод довольно грубый и не очень точный, однако при прогнозировании новинки с большим перечнем свойств, может очень сильно помочь. И да, телевизор — не совсем удачный продукт, так как он не является регулярным или с ярко-выраженной сезонностью, да и к тому же можно их всегда закупить побольше, так как у них нет таких сроков годности, как у пищевой продукции. Однако, именно как пример — он очень подходит, потому что максимально легок для восприятия.

Методы прогнозирования: итоги и полезные ссылки.

Здесь были рассмотрены самые распространенные и наиболее простые способы/методы прогнозирования. Помимо них существует еще и другие, в том числе и более сложные, например:

Модели на основе авторегрессии и среднего скользящего (ARIMA или модель Бокса-Дженкинса, ARIMAX и SARIMA)
Модели на основе нейронных сетей (построение прогноза с помощью искусственного интеллекта)
Прогнозирование с помощью «бутстреппинга»
И другие модели/способы/методы прогнозирования

Возможно, спустя какое-то время, по некоторым из них будут написаны отдельные статьи (либо будет расширена текущая).

Файл с примерами расчетов в Excel, можно скачать нажав на кнопку ниже:

Методы прогнозирования: скачать пример

Так как статья про методы прогнозирования получилась довольно большой, информация про «Обработку прогноза» вынесена в отдельную статью: «Прогнозирование, шаг 6.2: обработка прогноза».

Если вы хотите больше узнать больше информации по прогнозированию, изучить более сложные модели и методы прогнозирования, то вам могут пригодиться следующие ссылки:

Диссертация кандидата технических наук Чучуевой И.А. — «Модель прогнозирования временных рядов по выборке максимального подобия»
- Блог Чучуевой Ирины на Хабре — mbureau
Учебное пособие Тихонова Э.Е. — «Методы прогнозирования в условиях рынка» (хочу отметить, что Чучуева Ирина в своем блоге как раз опровергает некоторые суждения Тихонова, именно поэтому данное пособие, как и диссертация Ирины вызывают еще больший интерес)
Учебник Лукашина Ю. П. «Адаптивные методы краткосрочного прогнозирования временных рядов» — можно найти в свободном доступе в интернете
Ресурс, посвященный анализу данных и прогнозированию — MachineLearning.ru
Статья «Прогнозирование временных рядов с помощью модели экспоненциального сглаживания Хольта-Винтерса»
Учебное пособие Снитюка В.Е. «Прогнозирование. Модели. Методы. Алгоритмы»
Статья Юрова В.М. «Моделирование нестационарных временных рядов с выраженными колебаниями с использованием инструментов Excel»
Учебное пособие Арженовского С.В. «Статистические методы прогнозирования»
Учебное пособие Сухарева М.Г. «Методы прогнозирования»

Источник

Анализ временных рядов

Составляющие временного ряда

При анализе временного ряда выделяют три составляющие: тренд, сезонность и шум. Тренд — это общая тенденция, сезонность, как следует из названия — влияния периодичности (день недели, время года и т.д.) и, наконец, шум — это случайные факторы.

405400 км — это сезонность. Шум — это «случайные» факторы, например, влияние других планет. Если мы изобразим сумму этих трёх графиков, то мы получим временной ряд — функцию, показывающую изменение расстояния от земли до луны во времени.

Тренд. Методы сглаживания

Методы сглаживания необходимы для удаления шума из временного ряда. Существуют различные способы сглаживания, основные — это метод скользящей средней и метод экспоненциального сглаживания.