yi=β0+β1xi.
Неизвестные коэффициенты β0и β1линейной модели парной регрессии определяются с помощью метода наименьших квадратов. В результате мы получим оценённую модель регрессии вида:
После этого необходимо рассчитать остатки модели регрессии по формуле:
Полученные остатки модели регрессии возводятся в квадрат:
Далее для обнаружения гетероскедастичности остатков данной модели регрессии необходимо рассчитать коэффициент Спирмена между квадратами регрессионных остатков
и значениями факторной переменной xi.
Коэффициент Спирмена является аналогом парного коэффициента корреляции, однако, с его помощью можно оценить тесноту зависимости не только между количественными, но и между количественными и качественными переменными.
В качестве зависимой переменной будет выступать квадрат остатков модели регрессии
в качестве независимой переменной – значения факторной переменной xi.
Значения независимой переменной xi ранжируется и располагается по возрастанию. Ранги обозначаются как Rx. Далее проставляются ранги зависимой переменной
обозначаемые как Re.
Коэффициент Спирмена рассчитывается по формуле:
где d – ранговая разность (Rx– Re);
n – количество пар вариантов.
Далее необходимо проверить значимость вычисленного коэффициента Спирмена.
При проверке значимости коэффициента Спирмена выдвигается основная гипотеза о его незначимости:
Н0: Кспир=0.
Тогда конкурирующей или альтернативной гипотезой будет гипотеза вида:
Н1: Кспир≠0.
Проверка выдвинутых гипотез осуществляется с помощью t-критерия Стьюдента.
Наблюдаемое значение t-критерия (вычисленное на основе выборочных данных) сравнивают с критическим значением t-критерия, которое определяется по таблице распределения Стьюдента.
Критическое значение t-критерия tкрит(а, n-2) определяется по таблице распределения Стьюдента, где а – уровень значимости, (n-2) – число степеней свободы, n – объём выборочной совокупности.
Наблюдаемое значение t-критерия при проверке основной гипотезы вида Н0: Кспир=0 рассчитывается по формуле:
При проверке гипотез возможны следующие ситуации.
Если наблюдаемое значение t-критерия (вычисленное по выборочным данным) по модулю больше критического значения t-критерия (определённого по таблице распределения Стьюдента), т. е. |tнабл|›tкрит, то основная гипотеза отвергается, и между переменной xi и остатками регрессионной модели
существует взаимосвязь, т. е. в модели присутствует гетероскедастичность.
Если наблюдаемое значение t-критерия (вычисленное по выборочным данным) по модулю меньше или равно критического значения t-критерия (определённого по таблице распределения Стьюдента), т. е. |tнабл|≤tкрит, то основная гипотеза принимается, и в модели парной регрессии гетероскедастичность отсутствует.
Если тест Глейзера проводился для линейной модели множественной регрессии, то при принятии основной гипотезы делается вывод о том, что гетероскедастичность не зависит от выбранной переменной xmi.
59. Тест Голдфелда-Квандта обнаружения гетероскедастичности остатков модели регрессии
Основным условием проведения теста Голдфелда-Квандта является предположение о нормальном законе распределения случайной ошибки βi модели регрессии.
Рассмотрим применение данного теста на примере линейной модели множественной регрессии.
Предположим, что на основе проведённого исследования зависимость между переменными можно аппроксимировать линейной моделью множественной регрессии.
В модели множественной регрессии выбирается независимая переменная xik, от которой наиболее вероятно могут зависеть остатки модели ei.
На следующем этапе значения независимой переменной xik ранжируются
располагаются по возрастанию и делятся на равные 3 части.
Для I и III частей строятся две независимые модели регрессии вида:
Для каждой из построенных моделей регрессий рассчитываются суммы квадратов остатков:
Основная гипотеза H0 предполагает постоянство дисперсий случайных ошибок модели регрессии, т. е. присутствие в модели условия гомоскедастичности:
Альтернативная гипотеза H1 предполагает непостоянство дисперсиий случайных ошибок в различных наблюдениях, т. е. присутствие в модели условия гетероскедастичности:
Данные гипотезы проверяются с помощью F-критерия Фишера-Снедекора.
Наблюдаемое значение F-критерия (вычисленное на основе выборочных данных) сравнивают с критическим значением F-критерия, которое определяется по таблице распределения Фишера-Снедекора.
Критическое значение F-критерия определяется по таблице распределения Фишера-Снедекора в зависимости от уровня значимости а и двух степеней свободы: k1=nI–l и k2=nI–l, где l – число оцениваемых по данной выборке параметров.
Наблюдаемое значение F-критерия находят по формуле:
При проверке основной гипотезы возможны следующие ситуации.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т. е. Fнабл›Fкрит, то основная гипотеза отвергается, и, следовательно, в модели регрессии присутствует гетероскедастичность, зависящая от переменной xik.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) меньше или равно критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т. е. Fнабл‹Fкрит, то основная гипотеза принимается, и гетероскедастичность в модели множественной регрессии не зависит от переменной xik.
На следующем этапе проверяются другие независимые переменные, если есть предположение об их тесной связи с G2(εi).
Если тест Голдфелда-Квандта проводился для линейной модели парной регрессии, то вывод о принятии основной гипотезы означает гомоскедастичность построенной модели регрессии.
60. Устранение гетероскедастичности остатков модели регрессии
Существует множество методов устранения гетероскедастичности остатков модели регрессии. Рассмотрим некоторые из них.
Наиболее простым методом устранения гетероскедастичности остатков модели регрессии является взвешивание параметров модели регрессии. В этом случае отдельным наблюдениям независимой переменой, характеризующимся максимальным среднеквадратическим отклонением случайной ошибки, придаётся больший вес, а остальным наблюдениям с минимальным среднеквадратическим отклонением случайной ошибки придаётся меньший вес. После данной процедуры свойство эффективности оценок неизвестных коэффициентов модели регрессии сохраняется.
Если для устранения гетероскедастичности был использован метод взвешивания, то в результате мы получим взвешенную модель регрессии с весами
Предположим, что на основе имеющихся данных была построена линейная модель парной регрессии, в которой было доказано наличие гетероскедастичности остатков
Рассмотрим подробнее процесс взвешивания для данной модели регрессии.
Разделим каждый член модели регрессии на среднеквадратическое отклонение случайной ошибки G(βi):
В общем виде процесс взвешивания для линейной модели парной регрессии выглядит следующим образом:
Для более наглядного представления полученной модели регрессии воспользуемся методом замен:
В результате получим преобразованный вид взвешенной модели регрессии:
Преобразованная взвешенная модель регрессии является двухфакторной моделью регрессии.
Дисперсию случайной ошибки взвешенной модели регрессии можно рассчитать по формуле:
Полученный результат доказывает постоянство дисперсий случайных ошибок преобразованной модели регрессии, т. е. о выполнении условия гомоскедастичности.
Главный недостаток метода взвешивания заключается в необходимости априорного знания среднеквадратических отклонений случайных ошибок модели регрессии. По той причине, что в большинстве случаев данная величина является неизвестной, приходится использовать другие методы, в частности методы коррекции гетероскедастичности.