Прогнозирование на основе экспоненциального сглаживания. Экспоненциальное сглаживание

9 5. Метод экспоненциального сглаживания. Выбор постоянной сглаживания

При использовании метода наименьших квадратов для определения прогнозной тенденции (тренда) заранее предполагают, что все ретроспективные данные (наблюдения) обладают одинаковой информативностью. Очевидно, логичнее было бы учесть процесс дисконтирования исходной информации, то есть неравноценность этих данных для разработки прогноза. Это достигается в методе экспоненциального сглаживания путем придания последним наблюдения динамического ряда (то есть значениям, непосредственно предшествующим периоду упреждения прогноза) более значимых «весов» по сравнению с начальными наблюдениями. К достоинствам метода экспоненциального сглаживания следует также отнести простоту вычислительных операций и гибкость описания различных динамик процесса. Наибольшее применения метод нашел для реализации среднесрочных прогнозов .

5.1. Сущность метода экспоненциального сглаживания

Сущность метода состоит в том, что динамический ряд сглаживается с помощью взвешенной «скользящей средней», в которой веса подчиняются экспоненциальному закону. Другими словами, чем дальше от конца временного ряда отстоит точка, для которой вычисляется взвешенная скользящая средняя, тем меньше «участия она принимает» в разработке прогноза.

Пусть исходный динамический ряд состоит из уровней (составляющих ряда) y t , t = 1 , 2 ,...,n . Для каждыхm последовательных уровней этого ряда

(m

динамическому ряду с шагом, равным единице. Если m – нечетное число, а предпочтительно брать нечетное число уровней, поскольку в этом случае расчетное значение уровня окажется в центре интервала сглаживания и им легко заменить фактическое значение, то для определения скользящей средней можно записать следующую формулу:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t− ξ

i= t− ξ

2ξ + 1

где y t – значение скользящей средней для моментаt (t = 1 , 2 ,...,n );y i – фактическое значение уровня в моментi ;

i – порядковый номер уровня в интервале сглаживания.

Величина ξ определяется из продолжительности интервала сглаживания.

Поскольку

m =2 ξ +1

при нечетном m , то

ξ = m 2 − 1 .

Расчет скользящей средней при большом числе уровней можно упростить, определяя последовательные значения скользящей средней рекурсивно:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Но исходя из того, что последним наблюдениям необходимо придать больший «вес», скользящее среднее нуждается в ином толковании. Оно заключается в том, что полученная с помощью усреднения величина заменяет не центральный член интервала усреднения, а его последний член. Соответственно этому последнее выражение можно переписать в виде

M i = Mi + 1

y i− y i− m

Здесь скользящая средняя, относимая к концу интервала, обозначена новым символом M i . По существу,M i равноy t , сдвинутому наξ шагов вправо, то естьM i = y t + ξ , гдеi = t + ξ .

Учитывая, что M i − 1 является оценкой величиныy i − m , выражение (5.1)

можно переписать в виде

y i+ 1

M i − 1 ,

M i , определяемой выражением (5.1).

где M i является оценкой

Если вычисления (5.2) повторять по мере поступления новой информации

и переписать в ином виде, то получим сглаженную функцию наблюдений:

Q i= α y i+ (1 − α ) Q i− 1 ,

или в эквивалентной форме

Q t= α y t+ (1 − α ) Q t− 1

Вычисления, проводимые по выражению (5.3) с каждым новым наблюдением, называются экспоненциальным сглаживанием. В последнем выражении для отличия экспоненциального сглаживания от скользящего среднего введено обозначение Q вместоM . Величинаα , являющаяся

аналогом m 1 , называется постоянной сглаживания. Значенияα лежат в

интервале [ 0 , 1 ] . Еслиα представить в виде ряда

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

то нетрудно заметить, что «веса» убывают по экспоненциальному закону во времени. Например, для α = 0 , 2 получим

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Сумма ряда стремится к единице, а члены суммы убывают со временем.

Величина Q t в выражении (5.3) представляет собой экспоненциальную среднюю первого порядка, то есть среднюю, полученную непосредственно при

сглаживании данных наблюдения (первичное сглаживание). Иногда при разработке статистических моделей полезно прибегнуть к расчету экспоненциальных средних более высоких порядков, то есть средних, получаемых путем многократного экспоненциального сглаживания.

Общая запись в рекуррентной форме экспоненциальной средней порядка k имеет вид

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Величина k изменяется в пределах1, 2, …, p ,p+1 , гдеp – порядок прогнозного полинома (линейного, квадратичного и так далее).

На основе этой формулы для экспоненциальной средней первого, второго и третьего порядков получены выражения

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Определение параметров прогнозной модели методом экспоненциального сглаживания

Очевидно, что для разработки прогнозных значений на основе динамического ряда методом экспоненциального сглаживания необходимо вычислить коэффициенты уравнения тренда через экспоненциальные средние. Оценки коэффициентов определяются по фундаментальной теореме БраунаМейера, связывающей коэффициенты прогнозирующего полинома с экспоненциальными средними соответствующих порядков:

(− 1 )

aˆ p

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑ j

p= 0

p! (k− 1 ) !j = 0

где aˆ p – оценки коэффициентов полинома степенир .

Коэффициенты находятся решением системы (p + 1 ) уравнений сp + 1

неизвестными.

Так, для линейной модели

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

для квадратичной модели

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Прогноз реализуется по выбранному многочлену соответственно для линейной модели

ˆyt + τ = aˆ0 + aˆ1 τ ;

для квадратичной модели

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

где τ – шаг прогнозирования.

Необходимо отметить, что экспоненциальные средние Q t (k ) можно вычислить только при известном (выбранном) параметре, зная начальные условияQ 0 (k ) .

Оценки начальных условий, в частности, для линейной модели

Q (1 )= a

1 − α

Q(2 ) = a− 2 (1 − α ) a

для квадратичной модели

Q (1 )= a

1 − α

+ (1 − α )(2 − α ) a

2(1− α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q (3 )= a

3(1− α )

(1 − α )(4 − 3 α ) a

где коэффициенты a 0 иa 1 вычисляются методом наименьших квадратов.

Величина параметра сглаживания α приближенно вычисляется по формуле

α ≈ m 2 + 1 ,

где m – число наблюдений (значений) в интервале сглаживания. Последовательность вычисления прогнозных значений представлена на

Расчет коэффициентов ряда методом наименьших квадратов

Определение интервала сглаживания

Вычисление постоянной сглаживания

Вычисление начальных условий

Вычисление экспоненциальных средних

Вычисление оценок a 0 , a 1 и т.д.

Расчет прогнозных значений ряда

Рис. 5.1. Последовательность вычисления прогнозных значений

В качестве примера рассмотрим процедуру получения прогнозного значения безотказной работы изделия, выражаемой наработкой на отказ.

Исходные данные сведены в табл. 5.1.

Выбираем линейную модель прогнозирования в виде y t = a 0 + a 1 τ

Решение осуществим со следующими значениями начальных величин:

a 0 , 0 = 64, 2; a 1 , 0 = 31, 5; α = 0, 305.

Таблица 5.1. Исходные данные

Номер наблюдения, t

Длина шага, прогнозирования, τ

Наработка на отказ, y (час)

При этих значениях вычисленные «сглаженные» коэффициенты для

величины y 2 будут равны

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 )− Q (2 )

31, 9 ,

1− α

при начальных условиях

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

и экспоненциальных средних

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q (2 )

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

«Сглаженная» величина y 2 при этом вычисляется по формуле

Q i (1 )

Q i (2 )

a 0 ,i

a 1 ,i

ˆyt

Таким образом (табл. 5.2), линейная прогнозная модель имеет вид

ˆy t + τ = 224, 5+ 32τ .

Вычислим прогнозные значения для периодов упреждения в 2 года (τ = 1 ), 4 года (τ = 2 ) и так далее наработки на отказ изделия (табл. 5.3).

Таблица 5.3. Прогнозные значенияˆy t

Уравнение

t + 2

t + 4

t + 6

t + 8

t + 20

регрессии

(τ = 1 )

(τ = 2 )

(τ = 3 )

(τ = 5 )

τ =

ˆy t = 224, 5+ 32τ

Следует отметить, что суммарный «вес» последних m значений временного ряда можно вычислить по формуле

c = 1 − (m (− 1 ) m ) . m+ 1

Так, для двух последних наблюдений ряда (m = 2 ) величинаc = 1 − (2 2 − + 1 1 ) 2 = 0 , 667 .

5.3. Выбор начальных условий и определение постоянной сглаживания

Как следует из выражения

Q t= α y t+ (1 − α ) Q t− 1 ,

при проведении экспоненциального сглаживания необходимо знать начальное (предыдущее) значение сглаживаемой функции. В некоторых случаях за начальное значение можно взять первое наблюдение, чаще начальные условия определяются согласно выражениям (5.4) и (5.5). При этом величины a 0 , 0 ,a 1 , 0

и a 2 , 0 определяются методом наименьших квадратов.

Если мы не очень доверяем выбранному начальному значению, то, взяв большое значение постоянной сглаживания α черезk наблюдений, мы доведем

«вес» начального значения до величины (1 − α ) k << α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Таким образом, выбор постоянной сглаживания (или числа наблюдений в движущейся средней) предполагает принятие компромиссного решения. Обычно, как показывает практика, величина постоянной сглаживания лежит в пределах от 0,01 до 0,3.

Известно несколько переходов, позволяющих найти приближенную оценку α . Первый вытекает из условия равенства скользящей и экспоненциальной средней

α = m 2 + 1 ,

где m – число наблюдений в интервале сглаживания. Остальные подходы связываются с точностью прогноза.

Так, возможно определение α исходя из соотношения Мейера:

α ≈ S y ,

где S y – среднеквадратическая ошибка модели;

S 1 – среднеквадратическая ошибка исходного ряда.

Однако использование последнего соотношения затруднено тем, что достоверно определить S y иS 1 из исходной информации весьма сложно.

Часто параметр сглаживания, а заодно и коэффициенты a 0 , 0 иa 0 , 1

подбирают оптимальными в зависимости от критерия

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j= 0

путем решения алгебраической системы уравнений, которую получают, приравнивая к нулю производные

∂ S2

∂ S2

∂ S2

∂ a 0, 0

∂ a 1, 0

∂ a 2, 0

Так, для линейной модели прогнозирования исходный критерий равен

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j= 0

Решение этой системы с помощью ЭВМ не представляет никаких сложностей.

Для обоснованного выбора α также можно использовать процедуру обобщенного сглаживания, которая позволяет получить следующие соотношения, связывающие дисперсию прогноза и параметр сглаживания для линейной модели:

S п 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

для квадратичной модели

S п 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

где β = 1 α ;S y – СКО аппроксимации исходного динамического ряда.

Экспоненциальное сглаживание – более сложный метод взвешенного среднего. Каждый новый прогноз основан на предыдущем прогнозе плюс процент разницы между этим прогнозом и фактическим значением ряда в этой точке.

F t = F t -1 + (A t -1 - F t -1) (2)

Где: F t – прогноз для периода t

F t -1 – прогноз для периода t-1

– сглаживающая константа

A t - 1 – фактический спрос или продажи для периода t-1

Константа сглаживания представляет собой процент от ошибки про­гноза. Каждый новый прогноз равен предыдущему прогнозу плюс процент от предыдущей ошибки.

Чувствительность корректировки прогноза к ошибке определена кон­стантой сглаживания , чем ближе её значение к 0 , тем медленнее прогноз будет приспосабливаться к ошибкам прогноза (т.е. тем больше степень сгла­живания). Наоборот, чем ближе значение к 1,0 , тем выше чувствитель­ность и меньше сглаживание.

Выбор константы сглаживания – в основном вопрос свободного вы­бора или метода проб и ошибок. Цель состоит в том, чтобы выбрать такую константу сглаживания, чтобы, с одной стороны, прогноз остался достаточно чувствительным к реальным изменениям данных временного ряда, а с дру­гой – хорошо сглаживал скачки, вызванные случайными факторами. Обычно используемые значения находятся в диапазоне от 0,05 до 0,50.

Экспоненциальное сглаживание – один из наиболее широко исполь­зуемых методов прогнозирования, частично из – за минимальных требова­ний по хранению данных и легкости вычисления, а частично из-за той лёгко­сти, с которой система коэффициентов значимости может быть изменена простым изменением значения .

Таблица 3. Экспоненциальное сглаживание

Период Фактиче­ский спрос α= 0,1 α = 0,4
прогноз ошибка прогноз ошибка
10 000 - - - -
11 200 10 000 11 200-10 000=1 200 10 000 11 200-10 000=1 200
11 500 10 000+0,1(11 200-10 000)=10 120 11 500-10 120=1 380 10 000+0,4(11 200-10 000)=10 480 11 500-10 480=1 020
13 200 10 120+0,1(11 500-10 120)=10 258 13 200-10 258=2 942 10 480+0,4(11 500-10 480)=10 888 13 200-10 888=2 312
14 500 10 258+0,1(13 200-10 258)=10 552 14 500-10 552=3 948 10 888+0,4(13 200-10 888)=11 813 14 500-11 813=2 687
- 10 552+0,1(14 500-10 552)=10 947 - 11 813+0,4(14 500-11 813)=12 888 -



Методы для тенденции

Существует два важных метода, которые можно использовать для разработки прогнозов, когда присутствует тенденция. Один из них предпола­гает использование уравнения тенденции; другой – расширение экспонен­циального сглаживания.

Уравнение тенденции:

Линейное уравнение тенденции имеет следующий вид:

Y t = a + δ∙ t (3)

Где: t – определённое число периодов времени от t= 0 ;

Y t – прогноз периода t ;

α – значение Y t при t=0

δ – наклон линии.

Коэффициенты прямой α и δ , могут быть вычислены из статистических данных за определённый период, с использованием следующих двух урав­нений:

δ= , (4)

α = , (5)

Где: n – число периодов,

y – значение временного ряда

Таблица 3. Уровень тенденции.

Период (t) Год Уровень продаж (y) t∙y t 2
10 000 10 000
11 200 22 400
11 500 34 500
13 200 52 800
14 500 72 500
Итого: - 60 400 192 200

Вычислим коэффициенты линии тенденции:

δ=

Таким образом, линия тенденции Y t = α + δ ∙ t

В нашем случае, Y t = 43 900+1 100 ∙t ,

Где t = 0 для периода 0.

Составим уравнение для периода 6 (2015 год) и 7 (2016 год):

– прогноз на 2015 год.

Y 7 = 43 900+1 100*7= 51 600

Построим график:

Экспоненциальное сглаживание тенденций

Разновидность простого экспоненциального сглаживания может ис­пользоваться, когда временной ряд выявляет тенденцию. Эта разновидность называется экспоненциальным сглаживание, учитывающим тенденцию или, иногда, двойным сглаживанием. Оно отличается от простого экспоненциаль­ного сглаживания, которое используется только тогда, когда данные изме­няются вокруг некоторого среднего значения или имеют скачкообразные или постепенные изменения.

Если ряд выявляет тенденцию и при этом используется простое экспо­ненциальное сглаживание, то все прогнозы будут запаздывать по отноше­нию к тенденции. Например, если данные увеличиваются, то каждый про­гноз будет занижен. Наоборот, уменьшение данных даёт завышенный про­гноз. Графическое отображение данных может показать, когда двойное сглаживание будет предпочтительнее, чем простое.

Скорректированный тенденцией прогноз (TAF) состоит из двух элемен­тов: сглаженной ошибки и фактора тенденции.

TAF t +1 = S t + T t , (6)

Где: S t – сглаженный прогноз;

T t – оценка текущей тенденции

И S t = TAF t + α 1 (A t - TAF t) , (7)

T t = T t-1 + α 2 (TAF t –TAF t-1 – T t-1) (8)

Где α 1 , α 2 – сглаживающие константы.

Чтобы использовать этот метод, нужно выбрать значения α 1 , α 2 (обыч­ным путём подбора) и сделать начальный прогноз и оценку тенденций.

Таблица 4. Экспоненциальное сглаживание тенденции.

Простая и логически ясная модель временного ряда имеет следующий вид:

где b - константа, а ε - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения значения b из данных состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред- предпоследним, и т.д. Простое экспоненциальное сглаживание именно так и построено. Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не только те, которые попали в определенное окно. Точная формула простого экспоненциального сглаживания имеет вид:

Когда эта формула применяется рекурсивно, каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра α . Если α равен 1, то предыдущие наблюдения полностью игнорируются. Если а равен 0, то игнорируются текущие наблюдения. Значения α между 0 и 1 дают промежуточные результаты. Эмпирические исследования показали, что простое экспоненциальное сглаживание весьма часто дает достаточно точный прогноз.

На практике обычно рекомендуется брать α меньше 0,30. Однако выбор а больше 0,30 иногда дает более точный прогноз. Это значит, что лучше все же оценивать оптимальное значение α по реальным данным, чем использовать общие рекомендации.

На практике оптимальный параметр сглаживания часто ищется с использованием процедуры поиска на сетке. Возможный диапазон значений параметра разбивается сеткой с определенным шагом. Например, рассматривается сетка значений от α =0,1 до α = 0,9 с шагом 0,1. Затем выбирается такое значение α , для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Microsoft Excel располагает функцией Экспоненциальное сглаживание (Exponential Smoothing), которая обычно используется для сглаживания уровней эмпирического временного ряда на основе метода простого экспоненциального сглаживания. Для вызова этой функции необходимо на панели меню выбрать команду Tools - Data Analysis. На экране раскроется окно Data Analysis, в котором следует выбрать значение Экспоненциальное сглаживание. В результате появится диалоговое окно Экспоненциальное сглаживание , представленное на рис. 11.5.


В диалоговом окне Exponential Smoothing задаются практически те же параметры, го и в рассмотренном выше диалоговом окне Moving Average.

1. Input Range (Входные данные) - в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра.

2. Labels (Метки) - данный флажок опции устанавливается в том случае, если первая строка (столбец) во входном диапазоне содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия.

3. Damping factor (Фактор затухания) - в это поле вводится значение выбранного коэффициента экспоненциального сглаживания α . По умолчанию принимается значение α = 0,3.

4. Output options (Параметры вывода) - в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего необходимо установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего нужно установить флажок опции Standart Errors (Стандартные погрешности).

Воспользуемся функцией Экспоненциальное сглаживание для повторного решения рассмотренной выше задачи, но уже с помощью метода простого экспоненциального сглаживания. Выбранные значения параметров сглаживания представлены на рис. 11.5. На рис. 11.6 показаны рассчитанные показатели, а на рис. 11.7 - построенные графики.

Скользящая средняя позволяет прекрасно сглаживать данные. Но ее главный недостаток заключатся в том, что каждое значение в исходных данных для нее имеет одинаковый вес. Например, для средней скользящей использующей период шести недель каждому значению для каждой недели уделяется 1/6 веса. В случае некоторых собранных статистических данных более актуальным значениям присваивается больший вес. Поэтому экспоненциальное сглаживание применятся для того, чтобы придать самым актуальным данным большего веса. Таким образом решается данная статистическая проблема.

Формула расчета метода экспоненциального сглаживания в Excel

Ниже на рисунке изображен отчет спроса на определенный продукт за 26 недель. Столбец «Спрос» содержит информацию о количестве проданного товара. В столбце «Прогноз» – формула:

В столбце «Скользящая средняя» определяется прогнозируемый спрос, рассчитанный с помощью обычного вычисления скользящей средней с периодом 6 недель:

В последнем столбце «Прогноз», с описанной выше формулой применяется метод экспоненциального сглаживания данных в которых значения последних недель имеет больший вес чем предыдущих.

Коэффициент «Альфа:» вводится в ячейке G1, он значит вес присвоения наиболее актуальным данным. В данном примере он имеет значение 30%. Остальные 70% веса распределяется на остальные данные. То есть второе значение с точки зрения актуальности (с право на лево) имеет вес равный 30% от оставшихся 70% веса – это 21%, третье значение имеет вес равен 30% от остальной части 70% веса – 14,7% и так далее.



График экспоненциального сглаживания

Ниже на рисунке изображен график спроса, среднее скользящие и прогноз методом экспоненциального сглаживания, который построен на основе исходных значений:


Обратите внимание, что прогноз с экспоненциальным сглаживанием более активно реагирует на изменения спроса чем скользящая средняя линия.

Данные для очередных предыдущих недель умножаются на коэффициент альфа, а результат добавляется к оставшейся части процентов веса умноженный на предыдущее прогнозируемое значение.

Простая и логически ясная модель временного ряда имеет следующий вид:

Y t = b + e t

у, = Ь + г„ (11.5)

где b - константа, e - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения значения b из данных состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблю­дениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред- предпоследним, и т.д. Простое экспоненциальное сглаживание имен­но так и построено. Здесь более старым наблюдениям приписываются экспоненци­ально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не только те, которые попали в определен­ное окно. Точная формула простого экспоненциального сглаживания имеет вид:

S t = a y t + (1 - a) S t -1

Когда эта формула применяется рекурсивно, каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра a. Если a равен 1, то предыдущие наблюдения полностью игнорируются. Если aравен 0, то игнорируются текущие наблюдения. Значения a между 0 и 1 дают промежуточные результаты. Эмпирические исследования показали, что простое экспоненциальное сглаживание весьма часто дает достаточно точный прогноз.

На практике обычно рекомендуется брать a меньше 0,30. Однако выбор a больше 0,30 иногда дает более точный прогноз. Это значит, что лучше все же оценивать оптимальное значение a по реальным данным, чем использовать общие рекомендации.

На практике оптимальный параметр сглаживания часто ищется с использованием процедуры поиска на сетке. Возможный диапазон значений параметра разбивается сеткой с определенным шагом. Например, рассматривается сетка значений от a = 0,1 до a = 0,9 с шагом 0,1. Затем выбирается такое значение a, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Microsoft Excel располагает функцией Exponential Smoothing (Экспоненциальное сглаживание), которая обычно используется для сглаживания уровней эмпирической временного ряда на основе метода простого экспоненциального сглаживания. Для вызова этой функции необходимо на панели меню выбрать команду Tools Þ Data Analysis. На экране раскроется окно Data Analysis, в котором следует выбрать значение Exponential Smoothing (Экспоненциальное сглаживание). В результате появится диалоговое окно Exponential Smoothing.

В диалоговом окне Exponential Smoothing задаются практически те же параметры, что и в рассмотренном выше диалоговом окне Moving Average.

1. Input Range (Входные данные) - в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра.

2. Labels (Метки) - данный флажок опции устанавливается в том случае, если
первая строка (столбец) во входном диапазоне содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия.

3. Damping factor (Фактор затухания) - в это поле вводится значение выбранного коэффициента экспоненциального сглаживания а. По умолчанию принимаете значение а = 0,3.

4. Output options (Параметры вывода) - в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего необходимо установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего нужно установить флажок опции Standart Erroг (Стандартные погрешности).

Задание 2. С помощью программы Microsoft Excel, используя функцию Экспоненциального сглаживания (Exponential Smoothing), на основании данных об объеме выпуска Задания 1 рассчитать сглаженные уровни выпуска и стандартные погрешности. Затем представить фактические и прогнозируемые данные с помощью диаграммы. Подсказка: должна получиться таблица и график, аналогичный выполненному в задание 1, но с другими сглаженными уровнями и стандартными погрешностями.

Метод аналитического выравнивания

где - теоретические значения временного ряда, вычисленные по соответствующе­му аналитическому уравнению на момент времени t.

Определение теоретических (расчетных) значений , производится на основе так называемой адекватной математической модели, которая наилучшим образом отобра­жает основную тенденцию развития временного ряда.

Простейшими моделями (формулами), выражающими тенденцию развития, явля­ются следующие:

Линейная функция, график которой является прямой линией:

Показательная функция:

Y t = a 0 * a 1 t

Степенная функция второго порядка, график которой является параболой:

Y t = a 0 + a 1 * t + a 2 * t 2

Логарифмическая функция:

Y t = a 0 + a 1 * ln t

Расчет параметров функции обычно производится методом наименьших квадратов, в котором в качестве решения принимается точка минимума суммы квадра­тов отклонений между теоретическим и эмпирическим уровнями:

где - выровненные (расчетные) уровни, а Yt - фактические уровни.

Параметры уравнения a i удовлетворяющие этому условию, могут быть найдены решением системы нормальных уравнений. На основе найденного уравнения тренда вычисляются выровненные уровни.

Выравнивание по прямой используется в тех случаях, когда абсолютные приросты практически постоянны, т.е. когда уровни изменяются в арифметической прогрессии (или близко к ней).

Выравнивание по показательной функции применяется, когда ряд отражает развитие в геометрической профессии, т.е. цепные коэффициенты роста практически постоянны.

Выравнивание по степенной функции (параболе второго порядка) используется, ко­гда ряды динамики изменяются с постоянными цепными темпами прироста.

Выравнивание по логарифмической функции применяется, когда ряд отражает разви­тие с замедлением роста в конце периода, т.е. когда прирост в конечных уровнях вре­менного ряда стремится к нулю.

По вычисленным параметрам выполняется синтез трендовой модели функции, т.е. получение значений a 0 , a 1 , a ,2 и их подстановка в искомое уравнение.

Правильность расчетов аналитических уровней можно проверить по следующему условию: сумма значений эмпирического ряда должна совпадать с суммой вычислен­ных уровней выровненного ряда. При этом может возникнуть небольшая погрешность в расчетах из-за округления вычисляемых величин:

Для оценки точности трендовой модели используется коэффициент детерминации:

где - дисперсия теоретических данных, полученных по трендовой модели, а - дисперсия эмпирических данных.

Трендовая модель адекватна изучаемому процессу и отражает тенденцию его раз­вития при значениях R 2 , близких к 1.

После выбора наиболее адекватной модели можно сделать прогноз на любой из периодов. При составлении прогнозов оперируют не точечной, а интервальной оцен­кой, определяя так называемые доверительные интервалы прогноза. Величина довери­тельного интервала определяется в общем виде следующим образом:

где среднее квадратическое отклонение от тренда; t a - табличное значение t- критерия Стьюдента при уровне значимости a , которое зависит от уровня значимо­стиa (%) и числа степеней свободы к = п - т. Величина - определяется по формуле:

где и – фактические и расчетные значения уровней динамического ряда; п - число уровней ряда; т - количество параметров в уравнении тренда (для уравнения прямой т - 2, для уравнения параболы 2-го порядка т = 3).

После необходимых расчетов определяется интервал, в котором с определенной вероятностью будет находиться прогнозируемая величина.

С помощью Microsoft Excel строить трендовые модели достаточно просто. Сначала эмпирический временной ряд следует представить в виде диаграммы одного из сле­дующих типов: гистограмма, линейчатая диаграмма, график, точечная диаграмма, диаграмма с областями, а затем щелкнуть на диаграмме правой кнопкой мыши на од­ном из маркеров данных. В результате на диаграмме будет выделен сам временной ряд, а на экране раскроется контекстное меню. В этом ме­ню следует выбрать команду Add Trendline (Добавить линию тренда). На экран будет выведено диалоговое окно Add Trendline.

На вкладке Туре (Тип) этого диалогового окна выбирается требуемый тип тренда:

1. линейный (Linear);

2. логарифмический (Logarithmic);

3. полиномиальный, от 2-й до 6-й степени включительно (Polinomial);

4. степенной (Power);

5. экспоненциальный (Exponential);

6. скользящее среднее, с указанием периода сглаживания от 2 до 15 (Moving Average).

На вкладке Options (Параметры) этого диалогового окна задаются дополнительные параметры тренда.

1. Trendline Name (Название сглаженной кривой) - в этой группе выбирается на­звание, которое будет выведено на диаграмму для обозначения функции, исполь­зованной для сглаживания временного ряда. Возможны следующие варианты:

♦ Automatic (Автоматическое) - при установке переключателя в это положе­ние Microsoft Excel автоматически формирует название функции сглажива­ния тренда, основываясь на выбранном типе тренда, например Linear (Линейная функция).

♦ Custom (Другое) - при установке переключателя в данное положение в по­ле справа можно ввести собственное название для функции тренда, длиной до 256 символов.

2. Forecast (Прогноз) - в этой группе можно указать, на сколько периодов вперед (поле Forward) требуется спроектировать линию тренда в будущее и на сколько периодов назад (поле Backward) следует спроектировать линию тренда в про­шлое (эти поля недоступны в режиме скользящего среднего).

3. Set intercept (Пересечение кривой с осью Y в точке) - этот флажок опции и расположенное справа поле ввода позволяют непосредственно указать точку, в которой линия тренда должна пересекать ось Y (эти поля доступны не для всех режимов).

4. Display equation on chart (Показывать уравнение на диаграмме) - при установке этого флажка опции на диаграмму будет выведено уравнение, описывающее сглаживающую линию тренда.

5. Display R-squared value on chart (Поместить на диаграмму величину достоверно­сти аппроксимации R 2) - при установке данного флажка опции на диаграмме будет показано значение коэффициента детерминации.

Вместе с линией тренда на графике временного ряда могут быть также изображены планки погрешностей. Для вставки планок погрешностей необходимо выделить ряд данных, щелкнуть на нем правой кнопкой мыши и выбрать в раскрывшемся контек­стном меню команду Format Data Series. На экране раскроется диалоговое окно Format Data Series (Формат ряда данных), в котором следует перейти на вкладку Y Error Bars (Y-погрешности).

На этой вкладке с помощью переключателя Error amount (Величина погрешности) выбирается тип планок и вариант их расчета в зависимости от вида погрешности.

1. Fixed value (Фиксированное значение) - при установке переключателя в это положение за допустимую величину ошибки принимается заданное в поле счетчика справа постоянное значение;

2. Percentage (Относительное значение) - при установке переключателя в данное положение для каждой точки данных вычисляется допустимое отклонение, исходя из заданного в поле счетчика справа значения процента;

3. Standard deviation(s) (Стандартное отклонение) - при установке переключателя в данное положение для каждой точки данных вычисляется стандартное отклонение, которое затем умножается на заданное в поле счетчика справа число (коэффициент кратности);

4. Standard error (Стандартная погрешность) - при установке переключателя в данное положение принимается стандартная величина ошибки, постоянная для всех элементов данных;

5. Custom (Пользовательская) - при установке переключателя в это положение вводится произвольный массив значений отклонений в положительную и/или отрицательную сторону (можно ввести ссылки на диапазон ячеек).

Планки погрешностей тоже можно форматировать. Для этого их следует выделить щелчком правой кнопки мыши и выбрать в раскрывшемся контекстном меню коман­ду Format Error Bars (Формат планок погрешностей).

Задание 3. С помощью программы Microsoft Excel на основании данных об объеме выпуска Задания 1 необходимо:

Представить временной ряд в виде графика, построенного с помощью мастера диаграмм. Затем добавить линию тренда, подбирая наиболее подходящий вариант уравнения.

Представить полученные результаты в виде таблицы «Подбор уравнения тренда»:

Таблица «Подбор уравнения тренда»

Представить выбранное уравнение графически, вынеся в график данные о наименовании полученной функции и величину достоверности аппроксимации (R 2).

Задание 4. Ответьте на следующие вопросы:

1. При анализе тренда для некоторого набора данных коэффициент детерминации для линейной модели оказался равен 0,95, для логарифмической - 0,8, а для полинома третьей степени - 0,9636. Какая трендовая модель наиболее адекват­на изучаемому процессу:

а) линейная;

б) логарифмическая;

в) полином 3-й степени.

2. По данным, представленным в задании 1, спрогнозируйте объем выпуска про­дукции в 2003 году. Какая общая тенденция поведения исследуемой величины следует из результатов вашего прогноза:

а) наблюдается спад производства;

б) производство остается на прежнем уровне;

в) наблюдается рост производства.

В данном материале были рассмотрены основные характеристики временного ряда, мо­дели декомпозиции временного ряда, а также основные методы сглаживания ряда - метод скользящего среднего, экспоненциального сглаживания и аналитического вы­равнивания. Для решения этих задач Microsoft Excel предлагаются такие инструменты, как Moving Average (Скользящее среднее) и Exponential Smoothing (Экспоненциальное сглаживание), которые позволяют сглаживать уровни эмпирического временного ряда, а также команда Add Trendiine (Добавить линию тренда), которая позволяет строить модели тренда и делать прогноз на основе имеющихся значений временного ряда.

P.S. Чтобы включить «Пакет анализ данных», выберите команду Tools →Data Analysis (Сервис → Анализ данных).

Если Data Analysis отсутствует, то необходимо выполнить следующие действия:

1. Выбрать команду Tools → Add-ins (Надстройки).

2. Выбрать в предложенном списке настроек значение Analysis ToolPak (Пакет анализа), а затем щелкнуть ОК. После этого будет выполнена загрузка и подключение к Excel пакета настройки «Анализ данных». Соответствующая команда появится в меню Tools.


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27