Общий вид модели Оукена:
Yt=a0+ a1* wt+ ut
E (ut/wt) = 0t
Var (ut/wt) = бu2
t=1,2,...
где wt – темп прироста безработицы в году t;
Yt – темп роста валового внутреннего продукта (ВВП);
a0,a1 – параметры модели, подлежащие оценке.
При проверке качества спецификации данной эконометрической модели, задача состоит в оценке объясняющей способности независимой переменной или регрессора wt.
При проверке качества спецификации эконометрической модели перед нами стоит задача выяснить, какова же объясняющая способность регрессора wt.
Предположим, что неизвестные параметры модели Оукена были найдены с помощью метода наименьших квадратов. Необходимо проверить адекватность оценённой эконометрической модели. Для этого на основе выборочных данных рассчитывается коэффициент детерминации R2. Если коэффициент детерминации равен единице (R2=1), то можно сделать вывод, что поведение зависимой переменной Yt полностью объясняются поведением независимой переменной wt. Если коэффициент детерминации равен нулю (R2=0), то поведение независимой переменной wt не влияет на поведение зависимой переменной Yt в рамках построенной модели. Однако такой вывод должен быть доказан с помощью F-теста.
Основная гипотеза состоит в предположении о незначимости параметра a1 модели Оукена:
Н0: a1=0.
Обратная или конкурирующая гипотеза состоит в утверждении о значимости параметра a1 модели Оукена:
Н0: a1≠0.
Данные гипотезы проверяются с помощью F-критерия Фишера-Снедекора.
Наблюдаемое значение F-критерия (вычисленное на основе выборочных данных) сравнивают со значением F-критерия, которое определяется по таблице распределения Фишера-Снедекора, и называется критическим.
При проверке значимости коэффициента множественной корреляции критическое значение F-критерия определяется как Fкрит(a;k1;k2), где а – уровень значимости, k1=1 и k2=n–(l+1) – число степеней свободы, n – объём выборочной совокупности, l – число оцениваемых по выборке параметров.
При проверке основной гипотезы вида Н0: a1=0 наблюдаемое значение F-критерия Фишера-Снедекора рассчитывается по формуле:
F=(R2/l)/((1-R2)*(n-(l+1))).
Для рассматриваемой модели Оукена величина F-статистики равна:
F=R2/((1-R2)*(n-2)).
При проверке основной гипотезы возможны следующие ситуации.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т.е. Fнабл>Fкрит, то основная гипотеза о незначимости коэффициента a1 модели Оукена отвергается, и он признаётся значимым. В этом случае делается вывод о том, что независимая переменная в оценённой модели обладает способностью объяснять эндогенные значения Yt и модель считается качественной.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) меньше или равно критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т.е. Fнабл≤Fкрит, то основная гипотеза о незначимости коэффициента a1 модели Оукена принимается, и он признаётся незначимым. В этом случае делается вывод об отсутствии объясняющей способности рассматриваемой независимой переменной.
Процедура проверки адекватности модели Оукена на основании результатов интервального прогнозирования.
Интервальное прогнозирование подразумевает следующую процедуру объективного (формального) контроля адекватности модели:
1) все результаты наблюдения делятся на две выборки:
а) обучающая выборка, содержащая 90-95 % объема проведённых наблюдений, т. е. это выборка, на основании данных которой осуществляется оценка неизвестных параметров модели;
б) контрольная выборка, состоящая из оставшегося количества наблюдений;
2) модель оценивается (при условии адекватности всех предпосылок теоремы Гаусса-Маркова) с помощью метода наименьших квадратов;
3) задается доверительная вероятность (бета) из диапазона [0,95;0,999]. По значениям объясняющих переменных из контрольной выборки вычисляют точечные прогнозы ỹ0=ã0+ã1*w0 и строят доверительный интервал [y0+;y0-] для эндогенных переменных из контрольной выборки.
В том случае, если значения эндогенной переменной из контрольной выборки накрывается доверительными интервалами, то построенная модель считается адекватной. На её основе можно строить рабочие прогнозы и использовать для изучения объекта. Если же значения эндогенной переменной из контрольной выборки не накрывается доверительными интервалами, то модель не считается адекватной и подлежит доработке.
Процедура проверки адекватности модели Оукена на основании результатов точечного прогнозирования.
Предположим, что модель Оукена вида yt= a0+a1*wt+ut была оценена с помощью метода наименьших квадратов на основании данных из обучающей выборки. Для проверки адекватности модели была подготовлена контрольная выборка (y0;w0), где величины y0 и w0 были получены в процессе наблюдения исследуемых переменных. Прогноз зависимой переменной получается в результате подстановки в оценку модели регрессии значения w=w0 независимой переменной:
ỹ0=~a0+~a1*x0(1)
Среднеквадратичная ошибка прогноза (1) определяется по формуле:
Sy0=~бu*(1+q0)1/2,
где q0=w0T*Q*w0;
w0T=(1,w0) – вектор известного значения независимой переменной;
Q=(WT*W)-1.
Величина q0 учитывает в структуре среднеквадратической ошибки Sy0 погрешности (ошибки оценивания) величины ~a0. Если величина полученного прогноза (1) удовлетворяет с учетом среднеквадратической ошибки прогноза истинному значению, то модель признается адекватной, если нет – то модель подлежит доработке.
37. Определение мультиколлинеарности. Последствия мультиколлинеарности. Методы обнаружения мультиколлинеарности
Наибольшие затруднения в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторных переменных, когда более чем два фактора связаны между собой линейной зависимостью.
Мультиколлинеарностью для линейной множественной регрессии называется наличие линейной зависимости между факторными переменными, включёнными в модель.
Мультиколлинеарность – нарушение одного из основных условий, лежащих в основе построения линейной модели множественной регрессии.
Мультиколлинеарность в матричном виде – это зависимость между столбцами матрицы факторных переменных Х:
Если не учитывать единичный вектор, то размерность данной матрицы равна n*n. Если ранг матрицы Х меньше n, то в модели присутствует полная или строгая мультиколлинеарность. Но на практике полная мультиколлинеарность почти не встречается.
Можно сделать вывод, что одной из основных причин присутствия мультиколлинеарности в модели множественной регрессии является плохая матрица факторных переменных Х.
Чем сильнее мультиколлинеарность факторных переменных, тем менее надежной является оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.
Включение в модель мультиколлинеарных факторов нежелательно по нескольким причинам:
1) основная гипотеза о незначимости коэффициентов множественной регрессии может подтвердиться, но сама модель регрессии при проверке с помощью F-критерия оказывается значимой, что говорит о завышенной величине коэффициента множественной корреляции;
2) полученные оценки коэффициентов модели множественной регрессии могут быть неоправданно завышены или иметь неправильные знаки;
3) добавление или исключение из исходных данных одного-двух наблюдений оказывает сильное влияние на оценки коэффициентов модели;
4) мультиколлинеарные факторы, включённые в модель множественной регрессии, способны сделать её непригодной для дальнейшего применения.
Конкретных методов обнаружения мультиколлинеарности не существует, а принято применять ряд эмпирических приёмов. В большинстве случаев множественный регрессионный анализ начинается с рассмотрения корреляционной матрицы факторных переменных R или матрицы (ХТХ).
Корреляционной матрицей факторных переменных называется симметричная относительно главной диагонали матрица линейных коэффициентов парной корреляции факторных переменных: