Прогнозирование методом экспоненциального сглаживания (ES, exponential smoothing). Метод экспоненциального сглаживания скользящей средней в Excel

Простая и логически ясная модель временного ряда имеет следующий вид:

Y t = b + e t

у, = Ь + г„ (11.5)

где b - константа, e - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения значения b из данных состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблю­дениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред- предпоследним, и т.д. Простое экспоненциальное сглаживание имен­но так и построено. Здесь более старым наблюдениям приписываются экспоненци­ально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не только те, которые попали в определен­ное окно. Точная формула простого экспоненциального сглаживания имеет вид:

S t = a y t + (1 - a) S t -1

Когда эта формула применяется рекурсивно, каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра a. Если a равен 1, то предыдущие наблюдения полностью игнорируются. Если aравен 0, то игнорируются текущие наблюдения. Значения a между 0 и 1 дают промежуточные результаты. Эмпирические исследования показали, что простое экспоненциальное сглаживание весьма часто дает достаточно точный прогноз.

На практике обычно рекомендуется брать a меньше 0,30. Однако выбор a больше 0,30 иногда дает более точный прогноз. Это значит, что лучше все же оценивать оптимальное значение a по реальным данным, чем использовать общие рекомендации.

На практике оптимальный параметр сглаживания часто ищется с использованием процедуры поиска на сетке. Возможный диапазон значений параметра разбивается сеткой с определенным шагом. Например, рассматривается сетка значений от a = 0,1 до a = 0,9 с шагом 0,1. Затем выбирается такое значение a, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Microsoft Excel располагает функцией Exponential Smoothing (Экспоненциальное сглаживание), которая обычно используется для сглаживания уровней эмпирической временного ряда на основе метода простого экспоненциального сглаживания. Для вызова этой функции необходимо на панели меню выбрать команду Tools Þ Data Analysis. На экране раскроется окно Data Analysis, в котором следует выбрать значение Exponential Smoothing (Экспоненциальное сглаживание). В результате появится диалоговое окно Exponential Smoothing.

В диалоговом окне Exponential Smoothing задаются практически те же параметры, что и в рассмотренном выше диалоговом окне Moving Average.

1. Input Range (Входные данные) - в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра.

2. Labels (Метки) - данный флажок опции устанавливается в том случае, если
первая строка (столбец) во входном диапазоне содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия.

3. Damping factor (Фактор затухания) - в это поле вводится значение выбранного коэффициента экспоненциального сглаживания а. По умолчанию принимаете значение а = 0,3.

4. Output options (Параметры вывода) - в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего необходимо установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего нужно установить флажок опции Standart Erroг (Стандартные погрешности).

Задание 2. С помощью программы Microsoft Excel, используя функцию Экспоненциального сглаживания (Exponential Smoothing), на основании данных об объеме выпуска Задания 1 рассчитать сглаженные уровни выпуска и стандартные погрешности. Затем представить фактические и прогнозируемые данные с помощью диаграммы. Подсказка: должна получиться таблица и график, аналогичный выполненному в задание 1, но с другими сглаженными уровнями и стандартными погрешностями.

Метод аналитического выравнивания

где - теоретические значения временного ряда, вычисленные по соответствующе­му аналитическому уравнению на момент времени t.

Определение теоретических (расчетных) значений , производится на основе так называемой адекватной математической модели, которая наилучшим образом отобра­жает основную тенденцию развития временного ряда.

Простейшими моделями (формулами), выражающими тенденцию развития, явля­ются следующие:

Линейная функция, график которой является прямой линией:

Показательная функция:

Y t = a 0 * a 1 t

Степенная функция второго порядка, график которой является параболой:

Y t = a 0 + a 1 * t + a 2 * t 2

Логарифмическая функция:

Y t = a 0 + a 1 * ln t

Расчет параметров функции обычно производится методом наименьших квадратов, в котором в качестве решения принимается точка минимума суммы квадра­тов отклонений между теоретическим и эмпирическим уровнями:

где - выровненные (расчетные) уровни, а Yt - фактические уровни.

Параметры уравнения a i удовлетворяющие этому условию, могут быть найдены решением системы нормальных уравнений. На основе найденного уравнения тренда вычисляются выровненные уровни.

Выравнивание по прямой используется в тех случаях, когда абсолютные приросты практически постоянны, т.е. когда уровни изменяются в арифметической прогрессии (или близко к ней).

Выравнивание по показательной функции применяется, когда ряд отражает развитие в геометрической профессии, т.е. цепные коэффициенты роста практически постоянны.

Выравнивание по степенной функции (параболе второго порядка) используется, ко­гда ряды динамики изменяются с постоянными цепными темпами прироста.

Выравнивание по логарифмической функции применяется, когда ряд отражает разви­тие с замедлением роста в конце периода, т.е. когда прирост в конечных уровнях вре­менного ряда стремится к нулю.

По вычисленным параметрам выполняется синтез трендовой модели функции, т.е. получение значений a 0 , a 1 , a ,2 и их подстановка в искомое уравнение.

Правильность расчетов аналитических уровней можно проверить по следующему условию: сумма значений эмпирического ряда должна совпадать с суммой вычислен­ных уровней выровненного ряда. При этом может возникнуть небольшая погрешность в расчетах из-за округления вычисляемых величин:

Для оценки точности трендовой модели используется коэффициент детерминации:

где - дисперсия теоретических данных, полученных по трендовой модели, а - дисперсия эмпирических данных.

Трендовая модель адекватна изучаемому процессу и отражает тенденцию его раз­вития при значениях R 2 , близких к 1.

После выбора наиболее адекватной модели можно сделать прогноз на любой из периодов. При составлении прогнозов оперируют не точечной, а интервальной оцен­кой, определяя так называемые доверительные интервалы прогноза. Величина довери­тельного интервала определяется в общем виде следующим образом:

где среднее квадратическое отклонение от тренда; t a - табличное значение t- критерия Стьюдента при уровне значимости a , которое зависит от уровня значимо­стиa (%) и числа степеней свободы к = п - т. Величина - определяется по формуле:

где и – фактические и расчетные значения уровней динамического ряда; п - число уровней ряда; т - количество параметров в уравнении тренда (для уравнения прямой т - 2, для уравнения параболы 2-го порядка т = 3).

После необходимых расчетов определяется интервал, в котором с определенной вероятностью будет находиться прогнозируемая величина.

С помощью Microsoft Excel строить трендовые модели достаточно просто. Сначала эмпирический временной ряд следует представить в виде диаграммы одного из сле­дующих типов: гистограмма, линейчатая диаграмма, график, точечная диаграмма, диаграмма с областями, а затем щелкнуть на диаграмме правой кнопкой мыши на од­ном из маркеров данных. В результате на диаграмме будет выделен сам временной ряд, а на экране раскроется контекстное меню. В этом ме­ню следует выбрать команду Add Trendline (Добавить линию тренда). На экран будет выведено диалоговое окно Add Trendline.

На вкладке Туре (Тип) этого диалогового окна выбирается требуемый тип тренда:

1. линейный (Linear);

2. логарифмический (Logarithmic);

3. полиномиальный, от 2-й до 6-й степени включительно (Polinomial);

4. степенной (Power);

5. экспоненциальный (Exponential);

6. скользящее среднее, с указанием периода сглаживания от 2 до 15 (Moving Average).

На вкладке Options (Параметры) этого диалогового окна задаются дополнительные параметры тренда.

1. Trendline Name (Название сглаженной кривой) - в этой группе выбирается на­звание, которое будет выведено на диаграмму для обозначения функции, исполь­зованной для сглаживания временного ряда. Возможны следующие варианты:

♦ Automatic (Автоматическое) - при установке переключателя в это положе­ние Microsoft Excel автоматически формирует название функции сглажива­ния тренда, основываясь на выбранном типе тренда, например Linear (Линейная функция).

♦ Custom (Другое) - при установке переключателя в данное положение в по­ле справа можно ввести собственное название для функции тренда, длиной до 256 символов.

2. Forecast (Прогноз) - в этой группе можно указать, на сколько периодов вперед (поле Forward) требуется спроектировать линию тренда в будущее и на сколько периодов назад (поле Backward) следует спроектировать линию тренда в про­шлое (эти поля недоступны в режиме скользящего среднего).

3. Set intercept (Пересечение кривой с осью Y в точке) - этот флажок опции и расположенное справа поле ввода позволяют непосредственно указать точку, в которой линия тренда должна пересекать ось Y (эти поля доступны не для всех режимов).

4. Display equation on chart (Показывать уравнение на диаграмме) - при установке этого флажка опции на диаграмму будет выведено уравнение, описывающее сглаживающую линию тренда.

5. Display R-squared value on chart (Поместить на диаграмму величину достоверно­сти аппроксимации R 2) - при установке данного флажка опции на диаграмме будет показано значение коэффициента детерминации.

Вместе с линией тренда на графике временного ряда могут быть также изображены планки погрешностей. Для вставки планок погрешностей необходимо выделить ряд данных, щелкнуть на нем правой кнопкой мыши и выбрать в раскрывшемся контек­стном меню команду Format Data Series. На экране раскроется диалоговое окно Format Data Series (Формат ряда данных), в котором следует перейти на вкладку Y Error Bars (Y-погрешности).

На этой вкладке с помощью переключателя Error amount (Величина погрешности) выбирается тип планок и вариант их расчета в зависимости от вида погрешности.

1. Fixed value (Фиксированное значение) - при установке переключателя в это положение за допустимую величину ошибки принимается заданное в поле счетчика справа постоянное значение;

2. Percentage (Относительное значение) - при установке переключателя в данное положение для каждой точки данных вычисляется допустимое отклонение, исходя из заданного в поле счетчика справа значения процента;

3. Standard deviation(s) (Стандартное отклонение) - при установке переключателя в данное положение для каждой точки данных вычисляется стандартное отклонение, которое затем умножается на заданное в поле счетчика справа число (коэффициент кратности);

4. Standard error (Стандартная погрешность) - при установке переключателя в данное положение принимается стандартная величина ошибки, постоянная для всех элементов данных;

5. Custom (Пользовательская) - при установке переключателя в это положение вводится произвольный массив значений отклонений в положительную и/или отрицательную сторону (можно ввести ссылки на диапазон ячеек).

Планки погрешностей тоже можно форматировать. Для этого их следует выделить щелчком правой кнопки мыши и выбрать в раскрывшемся контекстном меню коман­ду Format Error Bars (Формат планок погрешностей).

Задание 3. С помощью программы Microsoft Excel на основании данных об объеме выпуска Задания 1 необходимо:

Представить временной ряд в виде графика, построенного с помощью мастера диаграмм. Затем добавить линию тренда, подбирая наиболее подходящий вариант уравнения.

Представить полученные результаты в виде таблицы «Подбор уравнения тренда»:

Таблица «Подбор уравнения тренда»

Представить выбранное уравнение графически, вынеся в график данные о наименовании полученной функции и величину достоверности аппроксимации (R 2).

Задание 4. Ответьте на следующие вопросы:

1. При анализе тренда для некоторого набора данных коэффициент детерминации для линейной модели оказался равен 0,95, для логарифмической - 0,8, а для полинома третьей степени - 0,9636. Какая трендовая модель наиболее адекват­на изучаемому процессу:

а) линейная;

б) логарифмическая;

в) полином 3-й степени.

2. По данным, представленным в задании 1, спрогнозируйте объем выпуска про­дукции в 2003 году. Какая общая тенденция поведения исследуемой величины следует из результатов вашего прогноза:

а) наблюдается спад производства;

б) производство остается на прежнем уровне;

в) наблюдается рост производства.

В данном материале были рассмотрены основные характеристики временного ряда, мо­дели декомпозиции временного ряда, а также основные методы сглаживания ряда - метод скользящего среднего, экспоненциального сглаживания и аналитического вы­равнивания. Для решения этих задач Microsoft Excel предлагаются такие инструменты, как Moving Average (Скользящее среднее) и Exponential Smoothing (Экспоненциальное сглаживание), которые позволяют сглаживать уровни эмпирического временного ряда, а также команда Add Trendiine (Добавить линию тренда), которая позволяет строить модели тренда и делать прогноз на основе имеющихся значений временного ряда.

P.S. Чтобы включить «Пакет анализ данных», выберите команду Tools →Data Analysis (Сервис → Анализ данных).

Если Data Analysis отсутствует, то необходимо выполнить следующие действия:

1. Выбрать команду Tools → Add-ins (Надстройки).

2. Выбрать в предложенном списке настроек значение Analysis ToolPak (Пакет анализа), а затем щелкнуть ОК. После этого будет выполнена загрузка и подключение к Excel пакета настройки «Анализ данных». Соответствующая команда появится в меню Tools.


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27

1. Основные методические положения.

В методе простого экспоненциального сглаживания применяется взвешенное (экспоненциально) скользящее усреднение всех данных предыдущих наблюдений. Эта модель чаще всего применяется к данным, в которых необходимо оценить наличие зависимости между анализируемыми показателями (тренда) или зависимость анализируемых данных. Целью экспоненциального сглаживания является оценка текущего состояния, результаты которого определят все последующие прогнозы.

Экспоненциальное сглаживание предусматривает постоянное обновление модели за счет наиболее свежих данных. Этот метод основывается на усреднении (сглаживании) временных рядов прошлых наблюдений в нисходящем (экспоненциально) направлении. То есть более поздним событиям присваивается больший вес. Вес присваивается следующим образом: для последнего наблюдения весом будет величина α, для предпоследнего – (1-α), для того, которое было перед ним, - (1-α) 2 и т.д.

В сглаженном виде новый прогноз (для периода времени t+1) можно представлять как взвешенное среднее последнего наблюдения величины в момент времени t и ее прежнего прогноза на этот же период t. Причем вес α присваивается наблюдаемому значению, а вес (1- α) – прогнозу; при этом полагается, что 0< α<1. Это правило в общем виде можно записать следующим образом.

Новый прогноз = [α*(последнее наблюдение)]+[(1- α)*последний прогноз]

где - прогнозируемое значение на следующий период;

α – постоянная сглаживания;

Y t – наблюдение величины за текущий период t;

Прежний сглаженный прогноз этой величины на период t.

Экспоненциальное сглаживание – это процедура для постоянного пересмотра результатов прогнозирования в свете самых последних событий.

Постоянная сглаживания α является взвешенным фактором. Ее реальное значение определяется тем, в какой мере текущее наблюдение должно влиять на прогнозируемую величину. Если α близко к 1, значит в прогнозе существенно учитывается величина ошибки последнего прогнозирования. И наоборот, при малых значениях α прогнозируемая величина наиболее близка к предыдущему прогнозу. Можно представить как взвешенное среднее значение всех прошлых наблюдений с весовыми коэффициентами, экспоненциально убывающими с «возрастом» данных.



Таблица 2.1

Сравнение влияния разных значений постоянных сглаживания

Постоянная α является ключом к анализу данных. Если требуется, чтобы спрогнозированные величины были стабильны и случайные отклонения сглаживались, необходимо выбирать малое значение α. Большое значение постоянной α имеет смысл в том случае, если нужна быстрая реакция на изменения в спектре наблюдений.

2. Практический пример проведения экспоненциального сглаживания.

Представлены данные компании по объему продаж (тыс. шт.) за семь лет, постоянная сглаживания взята равной 0,1 и 0,6. Данные за 7 лет составляют тестовую часть; по ним необходимо оценить эффективность каждой из моделей. Для экспоненциального сглаживания рядов начальное значение берется равным 500 (первое значение фактических данных или среднее значение за 3 -5 периодов записывается в сглаженное значения за 2 квартал).

Таблица 2.2

Исходные данные

Время Действительное значение (фактическое) Сглаженное значение Ошибка прогноза
год квартал 0,1 0,1
Excel по формуле
#Н/Д 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

На рис. 2.1 представлен прогноз на основе экспоненциального сглаживания с постоянной сглаживания, равной 0,1.



Рис. 2.1. Экспоненциальное сглаживание

Решение в Excel.

1. Выберите меню «Сервис» – «Анализ данных». В списке «Инструменты анализа» выберите значение «Экспоненциальное сглаживание». Если в меню «Сервис» нет анализа данных, то необходимо установить «Пакет анализа». Для этого найти в «Параметрах» пункт «Настройки» и в появившемся диалоговом окне установить флажок на «Пакет анализа», нажать ОК.

2. На экране раскроется диалоговое окно, представленное на рис. 2.2.

3. В поле «входной интервал» введите значения исходных данных (плюс одна свободная ячейка).

4. Установите флажок «метки» (если в диапазоне ввода указаны названия столбцов).

5. Введите в поле «фактор затухания» значение (1-α).

6. В поле «входной интервал» введите значение ячейки, в которой хотели бы увидеть полученные значения.

7. Установите флажок «Опции» - «Вывод графика» для автоматического его построения.

Рис. 2.2. Диалоговое окно для экспоненциального сглаживания

3. Задание лабораторной работы.

Имеются исходные данные об объемах добычи нефтедобывающего предприятия за 2 года, представленные в таблице 2.3:

Таблица 2.3

Исходные данные

Проведите экспоненциальное сглаживание рядов. Коэффициент экспоненциального сглаживания примите равным 0,1; 0,2; 0,3. Полученные результаты прокомментируйте. Можно использовать статистические данные, представленные в приложении 1.

Экстраполяция - это метод научного исследования, который основан на распространении прошлых и настоящих тенденций, закономерностей, связей на будущее развитие объекта прогнозирования. К методам экстраполяции относятся метод скользящей средней, метод экспоненциального сглаживания, метод наименьших квадратов.

Метод экспоненциального сглаживания наиболее эффективен при разработке среднесрочных прогнозов. Он приемлем при прогнозировании только на один период вперед. Его основные достоинства простота процедуры вычислений и возможность учета весов исходной информации. Рабочая формула метода экспоненциального сглаживания:

При прогнозировании данным методом возникает два затруднения:

  • выбор значения параметра сглаживания α;
  • определение начального значения Uo.

От величины α зависит , как быстро снижается вес влияния предшествующих наблюдений. Чем больше α, тем меньше сказывается влияние предшествующих лет. Если значение α близко к единице, то это приводит к учету при прогнозе в основном влияния лишь последних наблюдений. Если значение α близко к нулю, то веса, по которым взвешиваются уровни временного ряда, убывают медленно, т.е. при прогнозе учитываются все (или почти все) прошлые наблюдения.

Таким образом, если есть уверенность, что начальные условия, на основании которых разрабатывается прогноз, достоверны, следует использовать небольшую величину параметра сглаживания (α→0). Когда параметр сглаживания мал, то исследуемая функция ведет себя как средняя из большого числа прошлых уровней. Если нет достаточной уверенности в начальных условиях прогнозирования, то следует использовать большую величину α, что приведет к учету при прогнозе в основном влияния последних наблюдений.

Точного метода для выбора оптимальной величины параметра сглаживания α нет. В отдельных случаях автор данного метода профессор Браун предлагал определять величину α, исходя из длины интервала сглаживания. При этом α вычисляется по формуле:

где n – число наблюдений, входящих в интервал сглаживания.

Задача выбора Uo (экспоненциально взвешенного среднего начального) решается следующими способами:

  • если есть данные о развитии явления в прошлом, то можно воспользоваться средней арифметической и приравнять к ней Uo;
  • если таких сведений нет, то в качестве Uo используют исходное первое значение базы прогноза У1.

Также можно воспользоваться экспертными оценками.

Отметим, что при изучении экономических временных рядов и прогнозировании экономических процессов метод экспоненциального сглаживания не всегда «срабатывает». Это обусловлено тем, что экономические временные ряды бывают слишком короткими (15-20 наблюдений), и в случае, когда темпы роста и прироста велики, данный метод не «успевает» отразить все изменения.

Пример применения метода экспоненциального сглаживания для разработки прогноза

Задача . Имеются данные, характеризующие уровень безработицы в регионе, %

  • Постройте прогноз уровня безработицы в регионе на ноябрь, декабрь, январь месяцы, используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.
  • Рассчитайте ошибки полученных прогнозов при использовании каждого метода.
  • Сравните полученные результаты, сделайте выводы.

Решение методом экспоненциального сглаживания

1) Определяем значение параметра сглаживания по формуле:

где n – число наблюдений, входящих в интервал сглаживания. α = 2/ (10+1) = 0,2

2) Определяем начальное значение Uo двумя способами:
І способ (средняя арифметическая) Uo = (2,99 + 2,66 + 2,63 + 2,56 + 2,40 + 2,22 + 1,97 + 1,72 + 1,56 + 1,42)/10 = 22,13/10 = 2,21
II способ (принимаем первое значение базы прогноза) Uo = 2,99

3) Рассчитываем экспоненциально взвешенную среднюю для каждого периода, используя формулу

где t – период, предшествующий прогнозному; t+1 – прогнозный период; Ut+1 - прогнозируемый показатель; α - параметр сглаживания; Уt - фактическое значение исследуемого показателя за период, предшествующий прогнозному; Ut - экспоненциально взвешенная средняя для периода, предшествующего прогнозному.

Например:
Uфев = 2,99*0,2 +(1-0,2) * 2,21 = 2,37 (І способ)
Uмарт = 2,66*0,2+(1-0,2) * 2,37 = 2,43 (І способ) и т.д.

Uфев = 2,99*0,2 +(1-0,2) * 2,99 = 2,99 (II способ)
Uмарт = 2,66*0,2+(1-0,2) * 2,99 = 2,92 (II способ)
Uапр = 2,63*0,2+(1-0,2) * 2,92 = 2,86 (II способ) и т.д.

4) По этой же формуле вычисляем прогнозное значение
Uноябрь= 1,42*0,2+(1-0,2) * 2,08 = 1,95 (І способ)
Uноябрь= 1,42*0,2+(1-0,2) * 2,18 = 2,03 (ІІ способ)
Результаты заносим в таблицу.

5) Рассчитываем среднюю относительную ошибку по формуле:

ε = 209,58/10 = 20,96% (І способ)
ε = 255,63/10 = 25,56% (ІІ способ)

В каждом случае точность прогноза является удовлетворительной поскольку средняя относительная ошибка попадает в пределы 20-50%.

Решив данную задачу методами скользящей средней и наименьших квадратов , сделаем выводы.

02.04.2011 – Стремление человека приподнять завесу грядущего и предвидеть ход событий имеет такую же длинную историю, как и его попытки, понять окружающий мир. Очевидно, что в основе интереса к прогнозу лежат достаточно сильные жизненные мотивы (теоретические и практические). Прогноз выступает в качестве важнейшего метода проверки научных теорий и гипотез. Способность предвидеть будущее является неотъемлемой стороной сознания, без которой была бы невозможна сама человеческая жизнь.

Понятие “прогнозирование” (от греч. prognosis – предвидение, предсказание) означает процесс разработки вероятностного суждения о состоянии какого-либо явления или процесса в будущем, это познание того, чего еще нет, но что может наступить в ближайшее или отдаленное время.

Прогноз по своему содержанию более сложен, чем предсказание. Он, с одной стороны, отражает наиболее вероятное состояние объекта, а с другой – определяет пути и средства достижения желаемого результата. На основе полученной прогнозным путем информации по достижению желаемой цели, принимаются определенные решения.

Необходимо отметить, что динамика экономических процессов в современных условиях отличается нестабильностью и неопределенностью, что затрудняет применение традиционных методов прогнозирования.

Модели экспоненциального сглаживания и прогнозирования относятся к классу адаптивных методов прогнозирования, основной характеристикой которых является способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, подстраиваться под эту динамику, придавая, в частности, тем больший вес и тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они расположены к текущему моменту времени. Смысл термина состоит в том, что адаптивное прогнозирование позволяет обновлять прогнозы с минимальной задержкой и с помощью относительно несложных математических процедур.

Метод экспоненциального сглаживания был независимо открыт Брауном (Brown R.G. Statistical forecasting for inventory control, 1959) и Хольтом (Holt C.C. Forecasting Seasonal and Trends by Exponentially Weighted Moving Averages, 1957). Экспоненциальное сглаживание, как и метод скользящих средних, для прогноза использует прошлые значения временного ряда.

Сущность метода экспоненциального сглаживания заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, в которой веса подчиняются экспоненциальному закону. Взвешенная скользящая средняя с экспоненциально распределенными весами характеризует значение процесса на конце интервала сглаживания, то есть является средней характеристикой последних уровней ряда. Именно это свойство и используется для прогнозирования.

Обычное экспоненциальное сглаживание применяется в случае отсутствия в данных тренда или сезонности. В этом случае прогноз является взвешенной средней всех доступных предыдущих значений ряда; веса при этом со временем геометрически убывают по мере продвижения в прошлое (назад). Поэтому (в отличие от метода скользящего среднего) здесь нет точки, на которой веса обрываются, то есть зануляются. Прагматически ясная модель простого экспоненциального сглаживания может быть записана следующим (по представленной ссылке можно скачать все формулы статьи):

Покажем экспоненциальный характер убывания весов значений временного ряда – от текущего к предыдущему, от предыдущего к пред–предыдущему и так далее:

Если формула применяется рекурсивно, то каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, что результат сглаживания зависит от параметра адаптации альфа . Его можно интерпретировать как коэффициент дисконтирования, характеризующий меру девальвации данных за единицу времени. Причем влияние данных на прогноз экспоненциально убывает с “возрастом” данных. Зависимость влияния данных на прогноз при разных коэффициентах альфа приведена на рисунке 1.

Рисунок 1. Зависимость влияния данных на прогноз при разных коэффициентах адаптации

Следует заметить, что значение сглаживающего параметра не может равняться 0 или 1, так как в этом случае сама идея экспоненциального сглаживания отвергается. Так, если альфа равняется 1, то прогнозное значение F t+1 совпадает с текущим значением ряда Хt , при этом экспоненциальная модель стремится к самой простой “наивной” модели, то есть в этом случае прогнозирование является абсолютно тривиальным процессом. Если альфа равняется 0, то начальное прогнозное значение F 0 (initial value ) одновременно будет являться прогнозом для всех последующих моментов ряда, то есть прогноз в этом случае будет выглядеть в виде обычной горизонтальной линии.

Тем не менее, рассмотрим варианты сглаживающего параметра, близкие к 1 или 0. Так, если альфа близко к 1, то предыдущие наблюдения временного ряда практически полностью игнорируются. В случае если альфа близко к 0, то игнорируются уже текущие наблюдения. Значения альфа между 0 и 1 дают промежуточные результаты. По мнению ряда авторов, оптимальное значение альфа находится в пределах от 0,05 до 0,30. Однако иногда альфа , большее 0,30, дает лучший прогноз.

В целом лучше оценивать оптимальное альфа по исходным данным (при помощи поиска по сетке), а не использовать искусственные рекомендации. Тем не менее, в случае если значение альфа , превышающее 0,3, минимизирует ряд специальных критериев, то это указывает на то, что другая техника прогнозирования (с применением тренда или сезонности) способна обеспечить еще более точные результаты. Для нахождения оптимального значения альфа (то есть минимизации специальных критериев) используется квазиньютоновский алгоритм максимизации правдоподобия (вероятности), который эффективнее обычного перебора на сетке.

Перепишем уравнение (1) в виде альтернативного варианта, позволяющего оценить, как модель экспоненциального сглаживания “обучается” на своих прошлых ошибках:

Из уравнения (3) ярко видно, что прогноз на период t+1 подлежит изменению в сторону увеличения, в случае превышения фактического значения временного ряда в период t над прогнозным значением, и, наоборот, прогноз на период t+1 должен быть уменьшен, если Х t меньше, чем F t .

Отметим, что при использовании методов экспоненциального сглаживания важным вопросом всегда является определение начальных условий (начального прогнозного значения F 0 ). Процесс выбора начального значения сглаженного ряда называется инициализацией (initializing ), или, иначе, “разогревом” (“warming up ”) модели. Дело в том, что начальное значение сглаженного процесса может существенным образом повлиять на прогноз для последующих наблюдений. С другой стороны, влияние выбора уменьшается с длиной ряда и становится некритичным при очень большом числе наблюдений. Браун впервые предложил использовать в качестве стартового значения среднее динамического ряда. Другие авторы предлагают использовать в качестве начального прогноза первое фактическое значение временного ряда.

В середине прошлого века Хольт предложил расширить модель простого экспоненциального сглаживания за счет включения в нее фактора роста (growth factor ), или иначе тренда (trend factor ). В результате модель Хольта может быть записана следующим образом:

Данный метод позволяет учесть присутствие в данных линейного тренда. Позднее были предложены другие виды трендов: экспоненциальный, демпфированный и др.

Винтерс предложил усовершенствовать модель Хольта с точки зрения возможности описания влияния сезонных факторов (Winters P.R. Forecasting Sales by Exponentially Weighted Moving Averages, 1960).

В частности, он далее расширил модель Хольта за счет включения в нее дополнительного уравнения, описывающего поведение сезонной компоненты (составляющей). Система уравнений модели Винтерса выглядит следующим образом:

Дробь в первом уравнении служит для исключения сезонности из исходного ряда. После исключения сезонности (по методу сезонной декомпозиции Census I ) алгоритм работает с “чистыми” данными, в которых нет сезонных колебаний. Появляются они уже в самом финальном прогнозе (15), когда “чистый” прогноз, посчитанный почти по методу Хольта, умножается на сезонную компоненту (индекс сезонности ).

Экспоненциальное сглаживание – более сложный метод взвешенного среднего. Каждый новый прогноз основан на предыдущем прогнозе плюс процент разницы между этим прогнозом и фактическим значением ряда в этой точке.

F t = F t -1 + (A t -1 - F t -1) (2)

Где: F t – прогноз для периода t

F t -1 – прогноз для периода t-1

– сглаживающая константа

A t - 1 – фактический спрос или продажи для периода t-1

Константа сглаживания представляет собой процент от ошибки про­гноза. Каждый новый прогноз равен предыдущему прогнозу плюс процент от предыдущей ошибки.

Чувствительность корректировки прогноза к ошибке определена кон­стантой сглаживания , чем ближе её значение к 0 , тем медленнее прогноз будет приспосабливаться к ошибкам прогноза (т.е. тем больше степень сгла­живания). Наоборот, чем ближе значение к 1,0 , тем выше чувствитель­ность и меньше сглаживание.

Выбор константы сглаживания – в основном вопрос свободного вы­бора или метода проб и ошибок. Цель состоит в том, чтобы выбрать такую константу сглаживания, чтобы, с одной стороны, прогноз остался достаточно чувствительным к реальным изменениям данных временного ряда, а с дру­гой – хорошо сглаживал скачки, вызванные случайными факторами. Обычно используемые значения находятся в диапазоне от 0,05 до 0,50.

Экспоненциальное сглаживание – один из наиболее широко исполь­зуемых методов прогнозирования, частично из – за минимальных требова­ний по хранению данных и легкости вычисления, а частично из-за той лёгко­сти, с которой система коэффициентов значимости может быть изменена простым изменением значения .

Таблица 3. Экспоненциальное сглаживание

Период Фактиче­ский спрос α= 0,1 α = 0,4
прогноз ошибка прогноз ошибка
10 000 - - - -
11 200 10 000 11 200-10 000=1 200 10 000 11 200-10 000=1 200
11 500 10 000+0,1(11 200-10 000)=10 120 11 500-10 120=1 380 10 000+0,4(11 200-10 000)=10 480 11 500-10 480=1 020
13 200 10 120+0,1(11 500-10 120)=10 258 13 200-10 258=2 942 10 480+0,4(11 500-10 480)=10 888 13 200-10 888=2 312
14 500 10 258+0,1(13 200-10 258)=10 552 14 500-10 552=3 948 10 888+0,4(13 200-10 888)=11 813 14 500-11 813=2 687
- 10 552+0,1(14 500-10 552)=10 947 - 11 813+0,4(14 500-11 813)=12 888 -



Методы для тенденции

Существует два важных метода, которые можно использовать для разработки прогнозов, когда присутствует тенденция. Один из них предпола­гает использование уравнения тенденции; другой – расширение экспонен­циального сглаживания.

Уравнение тенденции:

Линейное уравнение тенденции имеет следующий вид:

Y t = a + δ∙ t (3)

Где: t – определённое число периодов времени от t= 0 ;

Y t – прогноз периода t ;

α – значение Y t при t=0

δ – наклон линии.

Коэффициенты прямой α и δ , могут быть вычислены из статистических данных за определённый период, с использованием следующих двух урав­нений:

δ= , (4)

α = , (5)

Где: n – число периодов,

y – значение временного ряда

Таблица 3. Уровень тенденции.

Период (t) Год Уровень продаж (y) t∙y t 2
10 000 10 000
11 200 22 400
11 500 34 500
13 200 52 800
14 500 72 500
Итого: - 60 400 192 200

Вычислим коэффициенты линии тенденции:

δ=

Таким образом, линия тенденции Y t = α + δ ∙ t

В нашем случае, Y t = 43 900+1 100 ∙t ,

Где t = 0 для периода 0.

Составим уравнение для периода 6 (2015 год) и 7 (2016 год):

– прогноз на 2015 год.

Y 7 = 43 900+1 100*7= 51 600

Построим график:

Экспоненциальное сглаживание тенденций

Разновидность простого экспоненциального сглаживания может ис­пользоваться, когда временной ряд выявляет тенденцию. Эта разновидность называется экспоненциальным сглаживание, учитывающим тенденцию или, иногда, двойным сглаживанием. Оно отличается от простого экспоненциаль­ного сглаживания, которое используется только тогда, когда данные изме­няются вокруг некоторого среднего значения или имеют скачкообразные или постепенные изменения.

Если ряд выявляет тенденцию и при этом используется простое экспо­ненциальное сглаживание, то все прогнозы будут запаздывать по отноше­нию к тенденции. Например, если данные увеличиваются, то каждый про­гноз будет занижен. Наоборот, уменьшение данных даёт завышенный про­гноз. Графическое отображение данных может показать, когда двойное сглаживание будет предпочтительнее, чем простое.

Скорректированный тенденцией прогноз (TAF) состоит из двух элемен­тов: сглаженной ошибки и фактора тенденции.

TAF t +1 = S t + T t , (6)

Где: S t – сглаженный прогноз;

T t – оценка текущей тенденции

И S t = TAF t + α 1 (A t - TAF t) , (7)

T t = T t-1 + α 2 (TAF t –TAF t-1 – T t-1) (8)

Где α 1 , α 2 – сглаживающие константы.

Чтобы использовать этот метод, нужно выбрать значения α 1 , α 2 (обыч­ным путём подбора) и сделать начальный прогноз и оценку тенденций.

Таблица 4. Экспоненциальное сглаживание тенденции.