Построение точечных и интервальных прогнозов. Определения доверительных интервалов прогноза

Вопрос 4. Доверительные интервалы прогноза. Оценка адекватности и точности моделœей

Заключительным этапом применения кривых роста яв­ляется экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t , соответ­ствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени опреде­ляется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желатель­но определить границы возможного изменения прогнозируемого по­казателя, задать «вилку» возможных значений прогнозируемого пока­зателя, ᴛ.ᴇ. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста͵ может быть вызвано:

1) субъективной ошибочностью выбора вида кривой;

2) погрешностью оценивания параметров кривых;

3) погрешностью, связанной с отклонением отдельных наблю­дений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, мо­жет быть отражена в виде доверительного интервала прогноза. До­верительный интервал, учитывающий неопределœенность, связанную с положением тренда, и возможность отклонения от этого тренда, опре­деляется в виде:

, (5.26)

где п - длина временного ряда;

L - период упреждения; - точечный прогноз на момент n+L ;

t a - значение t -статистики Стьюдента;

S p - средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содер­жат погрешность. Погрешность параметра а 0 приводит к вертикально­му сдвигу прямой, погрешность параметра а 1 изменению угла на­клона прямой относительно оси абсцисс. С учетом разброса кон­кретных реализаций относительно линий тренда, дисперсию S 2 p можно представить в виде:

, (5.27)

где: S y 2 -дисперсия отклонений фактических наблюдений от расчетных;

t l - время упреждения, для которого делается экстраполяция, t l = n + L ;

t - порядковый номер уровней ряда, t =1, 2,..., п ;

Порядковый номер уровня, стоящего в серединœе ряда, ;

Тогда доверительный интервал можно представить в виде:

. (5.28)

Обозначим корень в выражении (5.28) через К . Значение К за­висит только от п и L , ᴛ.ᴇ. от длины ряда и периода упреждения. По этой причине можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

. (5.29)

Выражение, аналогичное (5.28), можно получить для полинома второго порядка:

(5.30)

. (5.31)

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:

, (5.32)

где: y t - фактические значения уровней ряда,

Расчетные значения уровней ряда,

п - длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома. Чем выше степень полинома, тем шире доверительный интер­вал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствую­щих параметров уравнения.

Рис. 5.4. Доверительные интервалы прогноза для линœейного тренда

Доверительные интервалы прогнозов, полученных с использо­ванием уравнения экспоненты, определяют аналогичным образом. От­личие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме бывают определœены доверительные ин­тервалы для ряда кривых, имеющих асимптоты, в случае, если значе­ние асимптоты известно (к примеру, для модифицированной экспонен­ты).

В таблице 5.4 приведены значения К* в зависимости от длины временного ряда п и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (п ) значения К* умень­шаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений п : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L .

Таблица 5.4

Значения К* для оценки доверительных интервалов прогноза на основе линœейного тренда и параболического тренда при доверительной вероятности 0,9 (7)

При определении прогнозных значений того или иного явления с помощью экстраполяции наибольший интерес представляет, по-видимому, не сама экстраполяция – это более или менее механический прием, а определение доверительных интервалов прогноза.

Доверительные интервалы могут быть определены двояко: формально и неформально. Что касается последнего, то это дело экспертного суждения, которое выносится при качественном осмыслении результатов прогноза, сопоставлении их с другими имеющимися у эксперта данными. При этом, естественно, эксперт должен учитывать не только степень колеблемости фактических уровней вокруг тренда в прошлом, но и возможность деформации тренда в будущем (соответственно могут быть получены различные варианты прогноза).

Формальный доверительный интервал учитывает лишь ту неопределенность, которая связана с ограниченностью числа наблюдений и соответствующей неточностью найденных оценок параметров кривой. Основной вопрос, – в какой мере в будущем сохранится найденная тенденция, – естественно, не может быть решен с помощью таких доверительных интервалов. Это дело содержательного экономического анализа и экспертной оценки.

Основное внимание в данном учебном пособии уделим оценке формальных доверительных интервалов, базирующихся на статистическом анализе.

Соответствующая погрешность имеет следующие источники:

1) выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной, а тем более лучшей для экстраполяции в данных конкретных условиях;

2) оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению в пространстве свойственна некоторая неопределенность;

3) тренд характеризует средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.

Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения.

Погрешность, связанная со вторым и третьим источниками, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный прогноз преобразуется в интервальный.

Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень - время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Традиционно в качестве такого измерителя колеблемости используется среднее квадратическое (стандартное) отклонение (3.11).

Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае, смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал для тренда определяется как:

, (4.1)

где – средняя квадратическая ошибка тренда; –расчетное значение уровня ряда; –значение t -статистики Стьюдента.

В STATISTICA при расчете доверительных интервалов прогноза величину среднего квадратического отклонения S y можно определить, воспользовавшись таблицей дисперсионного анализа (см. рис. 3.17). Рассчитанное в ячейке Residual Mean Squares значение соответствует подкоренному выражению в формуле (3.11) для S y , то есть остаточной дисперсии.Остается только извлечь из него квадратный корень ( тыс.чел.).

Значение коэффициента доверия t=2,306 нам известно при оценке статистической значимости параметров линейной модели тренда.

Таким образом, доверительный интервал прогноза на 2011 год определяется как:

На 2012 год:

Этот прогноз можно интерпретировать следующим образом: число выездов россиян за границу с целью туризма в 2011 году с вероятностью 95% будет составлять от 12137,31 тыс.чел. до 13289,88 тыс. чел.

§ 4.1. Доверительные интервалы прогноза

Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t, соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать "вилку" возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:

1) субъективной ошибочностью выбора вида кривой;

2) погрешностью оценивания параметров кривых;

3) погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:

(4.1.),

где n - длина временного ряда;

L -период упреждения;

Точечный прогноз на момент n+L;

Значение t-статистики Стьюдента;

Средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра приводит к вертикальному сдвигу прямой, погрешность параметра - к изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию можно представить в виде:

(4.2.),

где - дисперсия отклонений фактических наблюдений от расчетных;

Время упреждения, для которого делается экстраполяция;

N + L ;

t- порядковый номер уровней ряда, t=1,2, ... , n;

Порядковый номер уровня, стоящего в середине ряда,

=(n+1):2

Тогда доверительный интервал можно представить в виде:

(4.3.)

Обозначим корень в выражении (4.3.) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

(4.4.)

Выражение, аналогичное (4.3.), можно получить для полинома второго порядка:

(4.5.)

или

(4.6.)

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:

(4.7.),

где - фактические значения уровней ряда,

Расчетные значения уровней ряда,

n- длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.

Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения

Рисунок 4.1. Доверительные интервалы прогноза для линейного тренда

Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).

В таблице 4.1. приведены значения K* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n) значения K* уменьшаются, с ростом периода упреждения L значения K* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n: чем больше длина ряда, тем меньшее влияние оказывает период упреждения L.


Таблица 4.1.

Значения К * для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7).

Линейный тренд

Параболический тренд

Длина ряда (n)

Период упреждения (L)

длина ряда (n)

период упреждения (L)

2,6380 2,8748 3,1399

2,4631 2,6391 2,8361

2,3422 2,4786 2,6310

2,2524 2,3614 2,4827

2,1827 2,2718 2,3706

2,1274 2,2017 2,2836

2,0837 2,1463 2,2155

2,0462 2,1000 2,1590

2,0153 2,0621 2,1131

1,9883 2,0292 2,0735

1,9654 2,0015 2,0406

1,9455 1,9776 2,0124

1,9280 1,9568 1,9877

1,9117 1,9375 1,9654

1,8975 1,9210 1,9461

1,8854 1,9066 1,9294

1,8738 1,8932 1,9140

1,8631 1,8808 1,8998

1,8538 1,8701 1,8876

3,948 5,755 8,152

3,459 4,754 6,461

3,144 4,124 5,408

2,926 3,695 4,698

2,763 3,384 4,189

2,636 3,148 3,808

2,536 2,965 3,516

2,455 2,830 3,286

2,386 2,701 3,100

2,330 2,604 2,950

2,280 2,521 2,823

2,238 2,451 2,717

2,201 2,391 2,627

2,169 2,339 2,549

2,139 2,293 2,481

2,113 2,252 2,422

2,090 2,217 2,371

2,069 2,185 2,325

2,049 2,156 2,284

§ 4.2. Проверка адекватности выбранных моделей

Проверка адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста) строится на анализе случайной компоненты. Случайная остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном ряду). Предположим, что исходный временной ряд описывает процесс, не подверженный сезонным колебаниям, т.е. примем гипотезу об аддитивной модели ряда вида:

(4.8.)

Тогда ряд остатков будет получен как отклонения фактических уровней временного ряда () от выравненных, расчетных ( ):

(4.9.)

При использовании кривых роста вычисляют, подставляя в уравнения выбранных кривых соответствующие последовательные значения времени.

Принято считать, что модель адекватна описываемому процессу, если значения остаточной компоненты удовлетворяют свойствам случайности, независимости, а также случайная компонента подчиняется нормальному закону распределения.

При правильном выборе вида тренда отклонения от него будут носить случайный характер. Это означает, что изменение остаточной случайной величины не связано с изменением времени. Таким образом, по выборке, полученной для всех моментов времени на изучаемом интервале, проверяется гипотеза о зависимости последовательности значений от времени, или, что то же самое, о наличии тенденции в ее изменении. Поэтому для проверки данного свойства может быть использован один из критериев, рассматриваемых в разделе I, например, критерий серий.

Если вид функции, описывающей систематическую составляющую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок.

В условиях автокорреляции оценки параметров модели, полученные по методу наименьших квадратов, будут обладать свойствами несмещенности и состоятельности (с этими свойствами знакомятся в курсе математической статистики). В то же время эффективность этих оценок будет снижаться, а, следовательно, доверительные интервалы будут иметь мало смысла в силу своей ненадежности.

Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Д арби ным и Уотсоном. Критерий Д арби на-Уотсона связан с гипотезой о существовании автокорреляции первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. Значение этого критерия определяется по формуле:

(4.10.)

Можно показать, что величина d приближенно равна:

d » 2(1- ) (4.11),

где - коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреляции между двумя рядами и ).

Из последней формулы видно, что если в значениях имеется сильная положительная автокорреляция ( » 1), то величина d=0 , в случае сильной отрицательной автокорреляции ( » -1) d=4. При отсутствии автокорреляции ( » 0) d=2.

Для этого критерия найдены критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Авторами критерия границы определены для 1, 2,5 и 5% уровней значимости . Значения критерия Д арби на-Уотсона при 5% уровне значимости приведены в таблице 4.2. В этой таблице и - соответственно нижняя и верхняя доверительные границы критерия Д арби на-Уотсона; - число переменных в модели; n - длина временного ряда.

Таблица 4.2.

Значения критерия Д арби на-Уотсона d 1 и d 2 при 5% уровне значимости

1,08

1,13

1,16

1,18

1,22

1,”4

1,26

1,27

1,29

1,32

1,33

1,34

1,35

1,36

1,37

1,38

1,49

1,41

1,36

1,37

1,38

1,39

1,41

1,42

1,43

1,44

1,45

1,45

1,46

1,47

1,48

1,48

1,49

1,51

1,51

1,52

1,52

0,95

0,98

1,02

1,05

1,08

1,13

1,15

1,17

1,19

1,21

1,22

1,24

1,26

1,27

1,28

1,31

1,32

1,33

1,34

1,35

1,54

1,54

1,54

1,53

1,53

1,54

1,54

1,54

1,54

1,55

1,55

1,55

1,56

1,56

1,56

1,57

1,57

1,57

1,58

1,58

1,58

1,59

0,82

0,86

0,93

0,97

1,03

1,05

1,08

1,12

1,14

1,16

1,18

1,21

1,23

1,24

1,26

1,27

1,28

1,29

1,75

1,73

1,71

1,69

1,68

1,68

1,67

1,66

1,66

1,66

1,66

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

Применение на практике критерия Д арби на-Уотсона основано на сравнении величины d, рассчитанной по формуле (4.10.), с теоретическими значениями d 1 и d 2 , взятыми из таблицы. Отметим, что большинство программных пакетов статистической обработки данных осуществляет расчет этого критерия (например, ППП "Олимп", "Мезозавр", "Statistica" и др.).

При сравнении величины d с и возможны следующие варианты:

1) Если d < , то гипотеза о независимости случайных отклонений (отсутствие автокорреляции) отвергается;

2) Если d > , то гипотеза о независимости случайных отклонений не отвергается;

3) Если £ d £ , то нет достаточных оснований для принятия решений, т.е. величина попадает в область "неопределенности".

Рассмотренные варианты относятся к случаю, когда в остатках имеется положительная автокорреляция.

Когда же расчетное значение d превышает 2, то можно говорить о том, что в существует отрицательная автокорреляция.

Для проверки отрицательной автокорреляции с критическими значениями и сравнивается не сам коэффициент d, а 4-d.

Для определения доверительных интервалов модели свойство нормальности распределения остатков имеет важное значение . Поскольку временные ряды экономических показателей, как правило, невелики (<50), то проверка распределения на нормальность может быть произведена лишь приближенно, например, на основе исследования показателей асимметрии и эксцесса.

При нормальном распределении показатели асимметрии (А) и эксцесса (Э) равны нулю. Так как мы предполагаем, что отклонения от тренда представляют собой выборку из некоторой генеральной совокупности, то можно определить выборочные характеристики асимметрии и эксцесса, а также их среднеквадратические ошибки.

Если выполняется хотя бы одно из неравенств

(4.17.),

то гипотеза о нормальном характере распределения отвергается.

Другие случаи требуют дополнительной проверки с помощью более мощных критериев.

Пример 4.1.

Программа выдала следующие характеристики ряда остатков:

длина ряда n=20;

коэффициент асимметрии А =0,6;

Коэффициент эксцесса Э=0,7.

На основании этих характеристик можно считать, что:

а) случайная компонента подчиняется нормальному закону распределения;

б) случайная компонента не подчиняется нормальному закону распределения;

в) требуется дополнительная проверка характера распределения случайной компоненты.

Решение:

Определим:


Т. к. одновременно выполняются оба неравенства


§ 4.3. Характеристики точности моделей

Важнейшими характеристиками качества модели, выбранной для прогнозирования, являются показатели ее точности. Они описывают величины случайных ошибок, полученных при использовании модели. Таким образом, чтобы судить о качестве выбранной модели, необходимо проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность.

На практике широко используется относительная ошибка прогноза, выраженная в процентах относительно фактического значения показателя:

(4.19.)

Также используются средние ошибки по модулю (абсолютные и относительные):

(4.20.),

Где n- число уровней временного ряда, для которых определялось прогнозное значение.

Из (4.18.), (4.19.) видно, что если абсолютная и относительная ошибка больше 0, то это свидетельствует о "завышенной" прогнозной оценке, если - меньше 0, то прогноз был занижен.

Очевидно, что все указанные характеристики могут быть вычислены после того, как период упреждения уже окончился, и имеются фактические данные о прогнозируемом показателе или при рассмотрении показателя на ретроспективном участке.

В последнем случае имеющаяся информация делится на две части: по первой - оцениваются параметры модели, а данные второй части рассматриваются в качестве фактических. Ошибки прогнозов, полученные ретроспективно (на втором участке) характеризуют точность применяемой модели.

На практике при проведении сравнительной оценки моделей могут использоваться такие характеристики качества как дисперсия () или среднеквадратическая ошибка прогноза (S):

(4.21.).

Чем меньше значения этих характеристик, тем выше точность модели.

О точности модели нельзя судить по одному значению ошибки прогноза. Например, если прогнозная оценка месячного уровня производства в июне совпала с фактическим значением, то это не является достаточным доказательством высокой точности модели. Надо учитывать, что единичный хороший прогноз может быть получен и по плохой модели, и наоборот.

Следовательно, о качестве применяемых моделей можно судить лишь по совокупности сопоставлений прогнозных значений с фактическими .

Простой мерой качества прогнозов может стать m - относительное число случаев, когда фактическое значение охватывалось интервальным прогнозом:

(4.22.),

где р - число прогнозов, подтвержденных фактическими данными;

q - число прогнозов, не подтвержденных фактическими данными.

Когда все прогнозы подтверждаются, q=0 и m =1.

Если же все прогнозы не подтвердились, то р =0 и m =0.

Отметим, что сопоставление коэффициентов m для разных моделей может иметь смысл при условии, что доверительные вероятности приняты одинаковыми.

Одна из основных задач, возникающих при экстраполяции тренда, заключается в определении доверительных интервалов прогноза. Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень -- время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Следовательно, при построении доверительного интервала прогноза следует учесть оценку колеблемости или вариации уровней ряда. Обычно такой оценкой является среднее квадратическое отклонение (стандартное отклонение) фактических наблюдений от расчетных, полученных при выравнивании динамического ряда.

Прежде чем приступить к определению доверительного интервала прогноза, необходимо сделать оговорку о некоторой условности рассматриваемого ниже расчета. То, что следует далее, является в некоторой мере произвольным перенесением результатов, найденных для регрессии выборочных показателей, на анализ динамических рядов. Дело в том, что предположение регрессионного анализа о нормальности распределения отклонений вокруг линии регрессии не может, по существу, безоговорочно утверждаться при анализе динамических рядов.

Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.

В общем виде доверительный интервал для тренда определяется как

  • ? расчетное значение yt;

Если t = i + L то уравнение определит значение доверительного интервала для тренда, продленного на L единиц времени.

Доверительный интервал для прогноза, очевидно, должен учитывать не только неопределенность, связанную с положением тренда, но возможность отклонения от этого тренда. В практике встречаются случаи, когда более или менее обоснованно для экстраполяции можно применить несколько типов кривых. При этом рассуждения иногда сводятся к следующему. Поскольку каждая из кривых характеризует один из альтернативных трендов, то очевидно, что пространство между экстраполируемыми трендами и представляет собой некоторую “естественную доверительную область” для прогнозируемой величины. С таким утверждением нельзя согласиться. Прежде всего потому, что каждая из возможных линий тренда отвечает некоторой заранее принятой гипотезе развития. Пространство же между трендами не связано ни с одной из них -- через него можно провести неограниченное число трендов. Следует также добавить, что доверительный интервал связан с некоторым уровнем вероятности выхода за его границы. Пространство между трендами не связано ни с каким уровнем вероятности, а зависит от выбора типов кривых. К тому же при достаточно продолжительном периоде упреждения это пространство, как правило, становится настолько значительным, что подобный “доверительный интервал” теряет всякий смысл.

При условии учета стандартных ошибок оценок параметров уравнения тренда (которые по определению являются выборочными, а следовательно, могут не являться оценками неизвестных генеральных параметров из-за проявления случайной ошибки репрезентативности), и не рассматривая последовательность преобразований получим общую формулу доверительного интервала прогноза.

где - значение прогноза, рассчитанного по уравнению тренда на период t+L

Средняя квадратическая ошибка тренда;

К - коэффициент, учитывающий ошибки коэффициентов уравнения тренда

Значение t-статистики Стьюдента.

Коэффициент К рассчитывается следующим образом

n ? число наблюдений (длина ряда динамики);

L - число прогнозов

Значение К зависит только от п и L, т. е. продолжительности наблюдения и периода прогнозирования.

КОНТРОЛЬНАЯ РАБОТА

по дисциплине «Планирование и прогнозирование

в условиях рынка»

на тему: Доверительные интервалы прогноза

Оценка адекватности и точности моделей


Глава 1. Теоретическая часть. 3

Глава 2. Практическая часть. 9

Список используемой литературы.. 13


Глава 1. Теоретическая часть

Доверительные интервалы прогноза. Оценка адекватности и точности моделей

1.1 Доверительные интервалы прогноза

Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t , соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать "вилку" возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:

1. субъективной ошибочностью выбора вида кривой;

2. погрешностью оценивания параметров кривых;

3. погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:


где n - длина временного ряда;

L -период упреждения;

y n + L -точечный прогноз на момент n+L;

t a - значение t-статистики Стьюдента;

S p - средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра а о приводит к вертикальному сдвигу прямой, погрешность параметра a 1 - к изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию можно представить в виде:

(1.2.),

где - дисперсия отклонений фактических наблюдений от расчетных;

t 1 - время упреждения, для которого делается экстраполяция;

t 1 = n + L ;


t - порядковый номер уровней ряда, t = 1,2,..., n;

Порядковый номер уровня, стоящего в середине ряда,

Тогда доверительный интервал можно представить в виде:

(1.3.),

Обозначим корень в выражении (1.3.) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

(1.4.),

Выражение, аналогичное (1.3.), можно получить для полинома второго порядка:

(1.5.),

(1.6.),

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:


(1.7.),

где y t - фактические значения уровней ряда,

Расчетные значения уровней ряда,

n - длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.

Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении S y , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения

Рисунок 1.1. Доверительные интервалы прогноза для линейного тренда

Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).

В таблице 1.1. приведены значения К* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n ) значения К* уменьшаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n : чем больше длина ряда, тем меньшее влияние оказывает период упреждения L .

Таблица 1.1.

Значения К* для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7).

Линейный тренд

Параболический тренд

Длина ряда (п)

Период упреждения (L)

длина ряда (п)

период упреждения (L)

7 2,6380 2,8748 3,1399 7 3,948 5,755 8,152
8 2,4631 2,6391 2,8361 8 3,459 4,754 6,461
9 2,3422 2,4786 2,6310 9 3,144 4,124 5,408
10 2,2524 2,3614 2,4827 10 2,926 3,695 4,698
11 2,1827 2,2718 2,3706 11 2,763 3,384 4,189
12 2,1274 2,2017 2,2836 12 2,636 3,148 3,808
13 2,0837 2,1463 2,2155 13 2,536 2,965 3,516
14 2,0462 2,1000 2,1590 14 2,455 2,830 3,286
15 2,0153 2,0621 2,1131 15 2,386 2,701 3,100
16 1,9883 2,0292 2,0735 16 2,330 2,604 2,950
17 1,9654 2,0015 2,0406 17 2,280 2,521 2,823
18 1,9455 1,9776 2,0124 18 2,238 2,451 2,717
19 1,9280 1,9568 1,9877 19 2,201 2,391 2,627
20 1,9117 1,9375 1,9654 20 2,169 2,339 2,549
21 1,8975 1,9210 1,9461 21 2,139 2,293 2,481
22 1,8854 1,9066 1,9294 22 2,113 2,252 2,422
23 1,8738 1,8932 1,9140 23 2,090 2,217 2,371
24 1,8631 1,8808 1,8998 24 2,069 2,185 2,325
25 1,8538 1,8701 1,8876 25 2,049 2,156 2,284

Глава 2. Практическая часть

Задание 1.5. Использование адаптивных методов в экономическом прогнозировании

1. Рассчитать экспоненциальную среднюю для временного ряда курса акций фирмы ЮМ. В качестве начального значения экспоненциальной средней взять среднее значение из 5 первых уровней ряда. Значение параметра адаптации а принять равным 0,1.

Таблица 1.2.

Курс акций фирмы IBM

1 510 11 494 21 523
2 497 12 499 22 527
3 504 13 502 23 523
4 510 14 509 24 528
5 509 15 525 25 529
6 503 16 512 26 538
7 500 17 510 27 539
8 500 18 506 28 541
9 500 19 515 29 543
10 495 20 522 30 541

2. По данным задания №1 рассчитать экспоненциальную среднюю при значении параметра адаптации а равным 0,5. Сравнить графически исходный временной ряд и ряды экспоненциальных средних, полученные при а =0,1 и а =0,5. Указать, какой ряд носит более гладкий характер.

3. Прогнозирование курса акций фирмы IBM осуществлялось на основе адаптивной полиномиальной модели второго порядка


,

где - период упреждения.

На последнем шаге получены следующие оценки коэффициентов:

На 1 день вперед (=1);

На 2 дня вперед (=2).

Решение задания 1.5

1. Определим

Найдем значения экспоненциальной средней при а =0,1.

. а =0,1 – по условию;

; S 1 = 0,1 х 510 + 0,9 х 506 = 506,4;

; S 2 = 0,1 х 497 + 0,9 х 506,4 = 505,46;

; S 3 = 0,1 х 504 + 0,9 х 505,46 = 505,31 и т.д.


а =0,5 – по условию.

; S 1 = 0,5 х 510 + 0,5 х 506 = 508;

; S 2 = 0,5 х 497 + 0,5 х 508 = 502,5 и т.д.

Результаты расчетов представлены в таблице 1.3.

Таблица 1.3.

Экспоненциальные средние

Экспоненциальная средняя

Экспоненциальная средняя

а =0,1

а =0,5

а =0,1

а =0,5

1 506,4 508 16 505,7 513,3
2 505,5 502,5 17 506,1 511,7
3 505,3 503,2 18 506,1 508,8
4 505,8 506,6 19 507,0 511,9
5 506,1 507,8 20 508,5 517
6 505,8 505,4 21 509,9 520
7 505,2 502,7 22 511,6 523,5
8 504,7 501,4 23 512,8 523,2
9 504,2 500,7 24 514,3 525,6
10 503,4 497,8 25 515,8 527,3
11 502,4 495,9 26 518,0 532,7
12 502,0 497,5 27 520,1 525,8
13 502,0 499,7 28 522,2 538,4
14 502,7 504,4 29 524,3 540,7
15 505,0 514,7 30 525,9 540,9

Рисунок 1.2. Экспоненциальное сглаживание временного ряда курса акций: А – фактические данные; В – экспоненциальная средняя при альфа = 0,1; С – экспоненциальная средняя при альфа = 0,5

При а =0,1 экспоненциальная средняя носит более гладкий характер, т.к. в этом случае в наибольшей степени поглощаются случайные колебания временного ряда.

3. Прогноз по адаптивной полиномиальной модели второго порядка формируется на последнем шаге, путем подстановки в уравнение модели последних значений коэффициентов и значения - времени упреждения.

Прогноз на 1 день вперед (= 1):

Прогноз на 2 дня вперед (= 2):


Список используемой литературы

1. Дуброва Т.А. Статистические методы прогнозирования в экономике: Учебное пособие / Московский государственный университет экономики, статистики и информатики. – М.: МЭСИ, 2003. – 52с.

2. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование М.: Финансы и статистика, 2001.

3. Лукашин Ю.П. Регрессионные и адаптивные методы прогнозирования. Учебное пособие. – М.: МЭСИ, 1997.