В связи с опровержением нулевой гипотезы возникает вопрос: можно ли в этой ситуации строить интервальные прогнозы по курсу доллара исходя из предположения о нормальном распределении остатков? Вот как на него отвечает известный американский профессор статистики Стэнфордского университета Т. Андерсон: «Приведенные процедуры проверки гипотез и построения доверительных областей были основаны на предположении о том, что наблюдения распределены нормально. Если предположение о нормальности не выполняется, то эти процедуры все же можно применять для больших выборок, используя асимптотическую теорию…
Значение приведенных теорем (доказывающих асимптотическую теорию. — Прим. авт.) состоит в том, что, опираясь на них, обычную теорию для нормального случая при больших объемах выборок можно использовать с достаточной точностью и в тех ситуациях, когда наблюдения не являются нормально распределенными»[11].
Можно ли применить асимптотическую теорию к распределению остатков, полученных с помощью статистической модели USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2)? Поскольку малой выборкой принято называть выборку, имеющую до 30 степеней свободы, а в нашей выборке имеется 210 степеней свободы, то вполне естественно, что асимптотическую теорию в этом случае можно использовать.
Почему столь важно строить интервальные прогнозы по курсу доллара исходя из предположения о нормальном распределении остатков? Дело в том, что нормальный закон распределения играет важнейшую роль в теории вероятностей. При этом главной особенностью этого закона является тот факт, что он является предельным законом, к которому — при определенных условиях — приближаются другие законы распределения. Предполагая, что остатки распределены согласно закону о нормальном распределении (т. е. их распределение определяется воздействием множества случайных причин), мы тем самым приписываем им следующие свойства, благоприятные для построения интервальных прогнозов.
Во-первых, график плотностей вероятностей нормального распределения (см. рис. 4.4) имеет колоколообразную форму, симметричную относительно средней (математического ожидания) μ. При этом плотность вероятностей нормального распределения определяется по формуле
где s — стандартное отклонение.
Следовательно, плотность вероятностей нормального распределения полностью определяется двумя параметрами остатков — их средней величиной (математического ожидания) μ и стандартным отклонением s.
Во-вторых, график плотностей вероятностей нормального распределения показывает, что для нормально распределенных остатков вероятность отклонения от их средней величины (математического ожидания) μ быстро уменьшается с ростом этого отклонения.
В-третьих, если μ = 0, а стандартное отклонение s = 1, то нормальное распределение с такими параметрами называется нормированным. При этом плотность вероятностей нормированного нормального распределения определяется по следующей формуле:
В-четвертых, если функцию нормированной плотности вероятностей распределения f(x) перевести в проценты (при 1 = 100 %), а затем построить график плотности вероятностей нормированного нормального распределения, то мы получим диаграмму, изображенную на рис. 4.5.
Исходя из этого рисунка можно прийти к выводу: если мы будем суммировать (интегрировать) вероятность попадания остатка в область интервального прогноза при стандартном отклонении s, то выяснится, что в этом случае в область интервального прогноза попадет 68,17 % всех нормально распределенных остатков. Соответственно при стандартном отклонении s = ± 2 в область интервального прогноза попадет 95,45 % всех нормально распределенных остатков, а при стандартном отклонении s = ± 3 в область интервального прогноза попадет 99,73 % всех нормально распределенных остатков. Заметим также, что чаще всего интервальные прогнозы строят исходя из 95 %-ного уровня надежности при нормированном стандартном отклонении, равном 1,96; либо при 99 %-ном уровне надежности при нормированном стандартном отклонении, равном 2,58; либо при 99,9 %-ном уровне надежности при нормированном стандартном отклонении 3,29.
4.4. Построение точечных и интервальных прогнозов
Таким образом, предположение о нормальном распределении остатков позволяет нам строить интервальные прогнозы исходя из определенных доверительных интервалов, точность которых можно проверить. Именно этим мы сейчас и займемся.
Однако прежде чем перейти к составлению интервальных прогнозов, нам необходимо исходя из уже решенного уравнения регрессии (4.3) составить точечный прогноз на май 2010 г. Последняя дата выбрана не случайно, так как это позволяет нам смоделировать ситуацию реального прогноза. Дело в том, что в этом случае в качестве базы данных мы использовали информацию по ежемесячному курсу доллара за период с июня 1992 г. по апрель 2010 г., а точечный прогноз составили на май 2010 г. Именно по такой схеме обычно в реальной жизни и делаются прогнозы.
Алгоритм действий № 11 Как в EViews построить точечный прогноз
С помощью опции FORECAST находим точечный прогноз на будущий месяц. В EViews точечные прогнозы выдаются автоматически: сразу же после использования опции FORECAST (см. алгоритм действий № 8 «Как оценить точность статистической модели в EViews») у нас в рабочем файле появляется файл USDollarf. Поскольку в качестве конечной даты для прогноза нас интересует май 2010 г., то при этом нужно проследить, чтобы в опции FORECAST SAMPLE (выборка для прогноза) последней датой был именно этот месяц, который в EViews обозначается как 2010m05 (рис. 4.6). Таким образом, открыв файл USDollarf, мы увидим предсказанные значения курса доллара с августа 1992 г. (прогноз на июнь и июль 1992 г. не строится из-за потери двух наблюдений, обусловленной созданием двух факторных лаговых переменных) по май 2010 г. В результате мы выяснили, что точечный прогноз курса доллара на конец мая 2010 г. у нас равен 29 руб. 31,37 коп. Этот прогноз на май 2010 г. (как, впрочем, и точечные прогнозы на другие месяцы) был рассчитан путем подстановки в формулу (4.3) соответствующих значений переменных:
USDOLLAR = 1,321092 × USDOLLAR(-1) — 0,319415 × USDOLLAR(-2) × USDOLLAR = 1,321092 × 29,28860 — 0,319415 × 29,36380 = 29,31370.
Алгоритм действий № 12 Как в EViews построить интервальные прогнозы Шаг 1. Как найти средние ошибки прогнозируемого курса доллара
Чтобы одновременно с точечным прогнозом вычислить величину интервального прогноза, нам следует в мини-окне FORECAST (см. шаг 2 алгоритма действий № 8 — заполнение мини-окна FORECAST) использовать дополнительную опцию S.E. (optional). Например, написать в этой опции аббревиатуру SE в качестве названия для нового файла, в который мы собираемся поместить средние ошибки прогнозируемого индивидуального значения курса доллара (рис. 4.7). В отличие от широко используемого (из-за простоты в расчетах) стандартного отклонения средняя ошибка прогнозируемого индивидуального значения включает не только стандартную ошибку, но и случайную ошибку (см. далее — «Математические подробности, связанные с расчетом интервальных прогнозов»), а потому делает интервал прогноза более надежным. Причем разница между стандартным отклонением и средней ошибкой прогнозируемого индивидуального значения нарастает из-за резких колебаний факторной переменной (предыдущего значения курса доллара), в то время как в обычные периоды она незначительна.