Смекни!
smekni.com

«Практика применения ит в статистике» (стр. 3 из 5)

После построения уравнения регрессии проводится проверка наличия у оценок

(случайных остатков) перечисленных свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное значения в использовании результатов регрессии и корреляции [80, c. 155].

Степень реалистичности доверительных интервалов параметров регрессии обеспечивается, если оценки будут не только несмещенными и эффективными, но и состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки.

Воспользуемся пятью предпосылками МНК, и проверим их наличие для модели (6).

Прежде всего, проверяется случайный характер остатков

– первая предпосылка МНК. С этой целью построим график зависимости остатков
от теоретических значений результативного признака (приложение Б, рисунок Б.1 – Б. 5 – Б. 7). Как видно из приложения остатки представляют собой случайные величины, следовательно, первая предпосылка МНК оправдана.

Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что

, (14)

Для рассматриваемых уравнений это условие выполняется. Однако вместе с тем несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин

, что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью наряду с изложенным графиком зависимости остатков
от теоретических значений результативного признака
строится график зависимости случайных остатков
от факторов, включаемых в регрессию
. Как видно из приложения Б рисунки Б.1 – Б.5, остатки на графиках расположены в виде горизонтальной полосы, следовательно они не зависят от значений
, т.о. выполняется второе условие МНК.

Необходимым условием для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.

В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора

остатки
имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность.

Для определения гомоскедастичности или гетероскедастичности, был использован метод Гольдфельда – Кванта, в результате исчислений величина R = 2,31, которая не превышает табличное значение F-критерия – 2,35, при 5%-ном уровне значимости для числа степеней свободы 42 для каждой остаточной суммы квадратов ((72-18-2*6)/2), подтверждая тем самым наличие гомоскедастичности.

При построении регрессионных моделей чрезвычайно важно соблюдение четвертой предпосылки МНК – отсутствие автокорреляции остатков, т.е. значения остатков

должны быть распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений.

Автокорреляция остатков может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными, и вызвана наличием ошибок измерения в значениях результативного признака. Во-вторых, в ряде случаев причину автокорреляции остатков следует искать в формулировке модели. Модель может не включать фактор, оказывающий существенное влияние на результат, влияние которого отражается в остатках, вследствие чего последние могут оказываться автокоррелированными. Очень часто этим фактором является фактор времени t. либо модель не учитывает несколько второстепенных факторов, совместное влияние которых на результат значительно ввиду совпадения тенденций их изменения или фаз циклических колебаний.

Для определения наличия автокорреляции в остатках воспользуемся критерия Дарбина – Уотсона. По первым разностям исходных показателей, за период с 2004-2009 годы, построим уравнение множественной линейной регрессии (приложение Б рисунок Б.6 – Б.7):

, (15)

В нашем случае фактическое значение критерия Дарбина – Уотсона для модели (15) составляет – 2,11483.

Сформулируем гипотезы:

Н0 - в остатках нет автокорреляции;

Н1 - в остатках есть положительная автокорреляция;

Н1 * - в остатках есть отрицательная автокорреляция.

Зададим уровень значимости α = 0,05. По таблицам значений критерия Дарбина – Уотсона определим для числа наблюдений n = 72 и числа независимых переменных модели k` = 5 критическое значение dL = 1,476 и dU = 1,77. Получим следующие промежутки внутри интервала (рисунок 1):

0 dL =1,476 dU = 1,77 4- dU =2,23 4- dL=2,5245 4

Рисунок 1 – Промежутки внутри интервала от 0 до 4

Следовательно, значение Дарбина – Уотсона для модели попадают в промежуток от dU = 1,77 и 4 – dU = 2,23, т.е. нет основания отклонять Н0, а значит автокорреляция остатков отсутствует.

Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.

Таким образом, в силу коинтегрируемости временных рядов и отсутствия автокорреляции в остатках можно произвести обоснование полученного уравнения. Так, первое на что следует обратить внимание это коэффициент детерминации R2. В нашем случае он составляет 91,63 %. То есть отобранные факторы на 91,63 % объясняют вариацию инфляции. Рассчитанный F-критерий Фишера для этого уравнения составляет 46,38, что значительно больше табличного значения. С этой точки зрения получена достаточно надежная эконометрическая модель, объясняющая более 90 % инфляции в белорусской экономике на современном этапе развития.

Таким образом, полученная итоговая модель инфляции является статистически адекватной, удовлетворяет условиям построения эконометрических моделей, и достаточно полно отражает реальную динамику инфляции (приложение Б, рисунок Б. 8.).

В результате следует ряд важнейших выводов: одним из наиболее существенных факторов инфляции в белорусской экономике на современном этапе развития является динамика потребительских цен в Республике Беларусь. Так, например, при увеличении потребительских цен в России на 1 процентный пункт инфляции в Беларуси возрастет на 1,08 процентных пункта. В свою очередь увеличение индекса цен на грузовые перевозки на 1 процентный пункт вызовет рост потребительских цен на 0,34 процентных пункта. Увеличение остальных показателей модели (6) на 1 процентный пункт приведет к менее значительному росту инфляции.

Таким образом, полученная модель может быть использована для определения уровня цен на ближайшую перспективу. Наличие в модели постоянного члена указывает на присутствие в экономике страны дополнительных факторов влияющих на индекс потребительских цен, показатели которых не учтены при построении уравнения.

Заключение

Окружающий мир нас насыщен информацией – разнообразные потоки данных окружают нас, захватывая в поле своего действия, лишая правильного восприятия действительности. Не будет преувеличением сказать, что информация становится частью действительности и нашего сознания.

Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности в хаосе случайных явлений. Даже простейшие методы позволяют существенно прояснить сложную ситуацию, первоначально поражающую нагромождением цифр. Таким образом, решение различных экономических задач невозможно без хорошего знания математической и экономической статистики и использования современных статистических пакетов.

Исследования показали, что использование современных информационных технологий в статистической деятельности крайне необходимо. Решение же различных экономических задач невозможно без хорошего знания теории статистики и экономики использования, а также использования современных статистических пакетов. В качестве примера в данной работе была выбрана система STATISTICA по следующим причинам:

1. наличие русскоязычной версии пакета, что существенно облегчает работу;