регистрация / вход

Автокорреляция рядов динамики

Федеральное агентство по образованию Тамбовский государственный университет им. Г. Р. Державина Академия экономики и предпринимательства Кафедра кадрового управления

Федеральное агентство по образованию

Тамбовский государственный университет им. Г. Р. Державина

Академия экономики и предпринимательства

Кафедра кадрового управления

Реферат по статистике на тему:

«Автокорреляция в рядах динамики и ее измерение»

Выполнила: студентка 2 курса 213 группы

Кудряшова Алина Игоревна

Специальность: Государственное и

муниципальное управление

Проверила: Золотухина В. М.

Тамбов 2010

Содержание:

Введение………..…………………………………………………………………3

1. Автокорреляция уровней………………………………………………………....4

2. Автокорреляционная функция………………………………………...…………6

3. Методы автокорреляции………………………………………………………..9

3.1 Метод скользящего окна………………………………………………...9

3.2 Метод аналитического выравнивания…………………………….......10

4. Модели с распределенным лагом……………………………………………….12

5. Изменения тенденции временного ряда……………………………………..…14

6. Проверка остаточных величин на автокорреляцию…………………...………16

7. Способы исключения автокорреляции ………………………………………...18

Заключение……………………………………………………...………………..19

Список использованной литературы…………………………………………...21

Введение

Корреляция — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными (возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин). Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции может быть отрицательным; положительная корреляция в таких условиях — корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции может быть положительным.

Автокорреляция — статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом, например, для случайного процесса — со сдвигом по времени.

1. Автокорреляция уровней

Эконометрические модели, характеризующие протекание процесса во времени или состояние одного объекта в последовательные моменты времени (или периоды времени), представляют модели временных рядо в . Временным рядом называется последовательность значений признака, принимаемых в течение нескольких последовательных моментов времени или периодов. Эти значения называются уровнями ряда . Между уровнями временного ряда, или ряда динамики, может иметься зависимость. В этом случае значения каждого последующего уровня ряда зависят от предыдущих. Подобную корреляционную зависимость между последовательными уровнями ряда динамики называют автокорреляцией уровней ряда .

Количественное измерение корреляции осуществляется посредством использования линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени:

. (9.1)

Если сдвиг во времени составляет всего один шаг, то соответствующий коэффициент корреляции называется коэффициентом автокорреляции уровней ряда первого порядка . При этом лаг равен 1. Измеряется же зависимость между соседними уровнями ряда. В общем случае число шагов (или циклов), на которые осуществляется сдвиг, характеризующий влияние запаздывания, также называется лагом . С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается.

Динамика уровней ряда может иметь основную тенденцию (тренд). Это весьма характерно для экономических показателей. Тренд является результатом совместного длительного действия множества, как правило, разнонаправленных факторов на динамику исследуемого показателя. Довольно часто динамика уровней ряда подвержена циклическим колебаниям, которые зачастую носят сезонный характер. Иногда не удается выявить тренд и циклическую компоненту . Правда нередко в этих случаях каждый следующий уровень ряда образуется как сумма среднего уровня ряда и некоторой случайной компоненты.

В очень многих случаях уровень временного ряда представляется в виде суммы тренда, циклической и случайной компонент или в виде произведения этих компонент. В первом случае это аддитивная модель временного ряда, во втором — мультипликативная модель . Исследование временного ряда заключается в выявлении и придании количественного выражения каждой из этих компонент, после чего удается использовать соответствующие выражения для прогнозирования будущих значений ряда. Можно также решать задачу построения модели взаимосвязи двух или нескольких временных рядов.

2. Автокорреляционная функция

Для выявления трендовой , циклической компонент можно использовать коэффициент автокорреляции уровней ряда и автокорреляционную функцию. Автокорреляционная функция — это последовательность коэффициентов автокорреляции уровней первого, второго и последующих порядков. Соответственно график зависимости значений автокорреляционной функции от величины лага (порядка коэффициента автокорреляции) — коррелограмма . Анализ автокорреляционной функции и коррелограммы позволяет определить лаг , при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная.

Прежде чем пояснить это, отметим: коэффициент автокорреляции характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Если ряд имеет сильную нелинейную тенденцию, коэффициент автокорреляции может приближаться к нулю. Знак его не может служить указанием на наличие возрастающей или убывающей тенденции в уровнях ряда.

Теперь об анализе структуры временного ряда с помощью автокорреляционной функции и коррелограммы. Довольно ясно, что, если наиболее высоким оказался коэффициент автокорреляции первого порядка, то исследуемый ряд содержит основную тенденцию, или тренд, и, скорее всего, только ее. Если ситуация иная, когда наиболее высоким оказался коэффициент корреляции некоторого отличного от единицы порядка, то ряд содержит циклические компоненты (циклические колебания) с периодом моментов времени. Наконец, если ни один из коэффициентов корреляции не является значимым, то достаточно правдоподобны следующие две гипотезы. Либо ряд не содержит ни тренда , ни циклических компонентов, так что его структура носит флуктуационный (резко случайный) характер. Либо имеется сильная нелинейная тенденция, обнаружение которой требует дополнительных специальных исследований.

Автокорреляция связана с нарушением третьего условия Гаусса — Маркова , что значение случайного члена (случайного компонента, или остатка) в любом наблюдении определяется независимо от его значений во всех других наблюдениях. Для экономических моделей характерна постоянная направленность воздействия не включенных в уравнение регрессии переменных, являющихся наиболее частой причиной положительной автокорреляции. Случайный член в регрессионной зависимости подвергается воздействию переменных, влияющих на зависимую переменную, которые не включены в уравнение регрессии. Если значение случайного компонента в любом наблюдении должно быть независимым от его значения в предыдущем наблюдении, то и значение любой переменной, «скрытой» в случайном компоненте, должно быть некоррелированным с ее значением в предыдущем наблюдении.

Попытки вычисления коэффициентов корреляции различных порядков и тем самым формирования автокорреляционной функции являются, так сказать, непосредственным выявлением корреляционной зависимости, которое иногда приводит к вполне удовлетворительным результатам. Имеются специальные процедуры оценивания неизвестного параметра σ в выражении линейной зависимости, представляющем рекуррентное соотношение, связывающее значения случайных компонентов в текущем и предыдущем наблюдениях (коэффициент авторегрессии ).

Тем не менее, необходимо иметь также и особые тесты на наличие или отсутствие корреляции по времени . В большинстве этих тестов используется такая идея: если имеется корреляция у случайных компонентов, то она присутствует также и в остатках, получаемых после применения к модели (уравнениям) обычного МНК . Не станем здесь вдаваться в подробности реализации этой идеи. Они не очень сложны, но связаны с громоздкими алгебраическими преобразованиями. Важнее иметь в виду следующее. Как правило, все или почти все они связаны с проверкой двух статистических гипотез. Нулевая гипотеза — отсутствие корреляции σ = 0. Альтернативная гипотеза либо просто состоит в том, что несправедлива гипотеза нулевая, т.е. σ ≠ 0, либо так называемая односторонняя, более точная σ > 0. Несмотря на вид второй (альтернативной) гипотезы, соответствующее распределение (используемое в критерии) зависит не только от числа наблюдений и количества регрессоров (объясняющих переменных), но и от всей матрицы коэффициентов при неизвестных в уравнениях системы.

Понятно, что невозможно составить таблицу критических значений для всех матриц, так что приходится использовать обходные способы применения таких тестов. В тесте Дарбина — Уотсона используются для этого верхняя и нижняя (две) границы, которые уже зависят только от количества наблюдений, регрессоров и уровня значимости, таким образом, их уже можно «затабулировать» (составить для них таблицы). Правда, применение их (границ) далеко не всегда просто! Все ясно, когда соответствующая статистика (эмпирическое, или рассчитанное распределение) Дарбина — Уотсона меньше нижней границы, то отвергается нулевая гипотеза и принимается альтернативная гипотеза. Если же тест больше верхней границы, то принимается первая (нулевая) гипотеза. Но если тест попадает между этими границами, ситуация становится неопределенной: непонятно как выбрать одну из двух гипотез. К сожалению, ширина этой неопределенной зоны вполне может быть довольно пространной. Естественно, что поэтому пытались и небезуспешно построить тесты, сужающие такую зону неопределенности.

Вернемся теперь к проблеме выявления основной зависимости. Для этого существуют различные методы. Это могут быть качественные методы и качественный анализ исследуемых временных рядов, в т.ч. построение и визуальный анализ графика зависимости уровней ряда от времени. Это могут быть методы сопоставления двух параллельных рядов и методы укрупнения интервалов. Поскольку они носят достаточно качественный характер, суть их понятна из названия и к тому же они приводятся в курсах статистики, не будем останавливаться на них подробно.

3. Методы автокорреляции

3.1 Метод скользящего окна

Несколько более гибок и опирается на количественные (аналитические) инструменты анализа метод скользящей средней , или скользящего окна. В нем последовательно рассчитывается вместо одного полного среднего для всех наблюдений ряд так называемых частных средних для трех, пяти наблюдений или более, номера которых постоянно сдвигаются вправо (в сторону увеличения). Таким образом, получается последовательность частных средних, которая отсеивает несущественные флуктуации и способна легче обнаружить тренд , чем данные исходного ряда.

Очевидно также, что при описанном выше использовании коэффициентов автокорреляции уровней ряда для выявления тренда используется сравнение коэффициентов автокорреляции первого порядка , рассчитанных по исходным и преобразованным уровням ряда . Ясно, что при наличии линейного тренда соседние уровни ряда тесно коррелируют. Для нелинейного тренда дело обстоит сложнее, но нередко может быть упрощено сведением к линейному случаю соответствующим преобразованием переменных.

3.2 Метод аналитического выравнивания

Основным способом моделирования и изучения таким образом основной тенденции временного ряда (ряда динамики) является аналитическое выравнивание временного ряда. При этом строится аналитическая функция, характеризующая зависимость уровней ряда динамики от времени. Эта функция называется также трендом . Сам такой способ выявления основной тенденции называется аналитическим выравниванием . Ранее были описаны различные способы определения типа тренда. В целом построение модели тренда включает следующие основные этапы:

1) выравнивание исходного ряда методом скользящей средней

2) расчет сезонной компоненты ;

3) устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных в модели;

4) аналитическое выравнивание уровней и расчет значений тренда с использованием полученного уравнения тренда;

5) расчет полученных по модели значений, генерируемых трендом и сезонной компонентой;

6) расчет абсолютных и относительных ошибок .

В качестве основной тенденции выдвигается гипотеза о некоторой аналитической функции, выражающей данную зависимость. Но ведь требуется еще определить коэффициенты (параметры) данной зависимости. Для определения (оценивания) параметров тренда используется обычный МНК . Критерием отбора наилучшей формы тренда является наибольшее значение скорректированного коэффициента детерминации .

Для устранения тренда применяют метод отклонений от тренда , в ходе которого вычисляются значения тренда для каждого ряда динамики модели и отклонения от тренда. Для последующего анализа уже применяют не исходные данные, а отклонения от тренда.

Другой способ устранения тренда — это метод последовательных разностей . Если тренд линейный , то исходные данные заменяются первыми разностями, которые в этом случае равны просто коэффициенту регрессии b, сложенному с разностью соответствующих случайных компонент. Если тренд параболический, то исходные данные заменяются вторыми разностями. В случае экспоненциального и степенного тренда метод последовательных разностей применяется к логарифмам исходных данных. Не следует упускать из виду и уже обсуждавшуюся выше автокорреляцию в остатках. Для выявления автокорреляции остатков используется критерий Дарбина — Уотсона .

 Критерий Дарбина-Уотсона представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.

Численное значение коэффициента равно

d = [( e (2)- e (1)) 2 + ... + ( e ( n )- e ( n -1)) 2 ]/[ e (1) 2 + ... + e (n) 2 ],

где e ( t ) - остатки.

Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).

Значение d близко к величине 2*(1 - r 1 ), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие - отрицательной.

4. Модели с распределенным лагом

Рассматриваются также и эконометрические модели, содержащие не только текущие, но и лаговые (учитывающие запаздывание) значения факторных переменных. Эти модели так и называются моделями с распределенным лагом . Если максимальная величина лага конечна, то для такой модели зависимость имеет довольно простой вид. Это просто сумма свободного члена и произведений коэффициентов (регрессии) на факторные переменные (в текущий момент, в предшествующий момент, в предпредшествующий момент и т.д.). Естественно, имеется еще и случайный член. Последовательные суммы соответствующих коэффициентов при значениях факторов в различные моменты времени называются промежуточными мультипликаторами . Для максимального лага воздействие фактора на результативное переменное описывается полной суммой соответствующих коэффициентов, которая и называется долгосрочным мультипликатором . После деления этих коэффициентов на долгосрочный мультипликатор получаются относительные коэффициенты модели с распределенным лагом . По формуле средней арифметической взвешенной получают величину среднего лага модели множественной регрессии. Эта величина представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент t. Имеется также медианный лаг — период, в течение которого с момента времени t будет реализована 1/2 общего воздействия фактора на результат.

Во многих практически интересных ситуациях выявление тренда (при всей важности этого) вовсе не является завершением исследования структуры ряда и требуется по крайней мере обнаружение и изучение еще циклической (сезонной) составляющей. Проще всего для решения подобных задач использовать метод скользящей средней , далее построить аддитивную или мультипликативную модель временного ряда . Если амплитуда сезонных колебаний (или циклических колебаний) приблизительно постоянна, то строят аддитивную модель временного ряда, в котором значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, то строят мультипликативную модель . В мультипликативной модели уровни ряда зависят от значений сезонной компоненты .

В остальном схема во многом аналогична приведенной выше с очевидными модификациями. Именно процесс построения модели включает следующие шаги:

1) выравнивание исходного ряда методом скользящей средней;

2) расчет значений сезонной компоненты;

3) устранение сезонной компоненты из исходных уровней.

После этого наступает очередь шагов второго уровня:

4) получение выровненных данных в аддитивной или мультипликативной модели соответственно;

5) аналитическое выравнивание этих, один раз уже выровненных уровней суперпозиции компонент тренда и циклической и расчет значений тренда в этой усовершенствованной модели с использованием полученного уравнения тренда;

6) расчет уже по этой модели значений суперпозиции тренда и циклической компоненты и расчет абсолютных и относительных ошибок.

Если полученные значения ошибок не содержат автокорреляции , то ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.

Иногда строится модель регрессии с включением (явно) фактора времени и фиктивных переменных. При этом количество фиктивных переменных должно быть на единицу меньше числа моментов (периодов) времени внутри одного цикла колебаний. Каждая фиктивная переменная отражает сезонную (циклическую) компоненту ряда для какого-либо одного периода, поэтому она просто численно равна единице для данного периода и нулю для всех остальных периодов. Основным недостатком модели с фиктивными переменными является большое количество фиктивных переменных во многих случаях и тем самым снижение числа степеней свободы. В свою очередь, уменьшение числа степеней свободы снижает вероятность получения статистически значимых оценок параметров уравнения регрессии.

5. Изменения тенденции временного ряда

Кроме сезонных и циклических колебаний весьма важную роль играют единовременные изменения характера тенденции временного ряда . Эти (относительно) быстрые однократные изменения тренда (его характера) вызываются структурными изменениями в экономике либо мощными глобальными (внешними) факторами. Прежде всего выясняется, значимо ли повлияли общие структурные изменения на характер тренда . При условии значимости такого влияния (структурных изменений) на характер тренда используется кусочно-линейная модель регрессии. Кусочно-линейная модель означает представление исходной совокупности данных ряда в виде двух частей. Одна часть данных моделируется просто линейной моделью с одним коэффициентом регрессии (углом наклона прямой) и представляет данные до момента (периода) структурных изменений. Вторая часть данных — это тоже линейная модель, но уже с иным коэффициентом регрессии (углом наклона).

После построения двух таких моделей (подмоделей) линейной регрессии получают уравнения двух соответствующих прямых. Если структурные изменения незначительно повлияли на характер тенденции ряда, то вместо построения точной кусочно-линейной модели вполне можно использовать единую аппроксимирующую модель , т.е. одну общую линейную зависимость (одну прямую), тоже вполне приемлемо представляющую данные в целом. Незначительное ухудшение в отдельных данных при этом непринципиально.

Если строится кусочно-линейная модель, то снижается остаточная сумма квадратов по сравнению с единым для всей совокупности уравнением тренда. В то же время разделение исходной совокупности на две части ведет к потере числа наблюдений и тем самым к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Единое уравнение для всей совокупности данных позволяет сохранить число наблюдений исходной совокупности. Остаточная сумма квадратов по этому уравнению в то же время выше, чем такая же сумма для кусочно-линейной модели. Выбор конкретной — кусочно-линейной или просто линейной — модели, т.е. единого уравнения тренда, зависит от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.

Для оценки этого соотношения был предложен статистический тест Грегори — Чоу . В этом тесте рассчитываются параметры уравнений трендов, вводится гипотеза о структурной стабильности тенденции исследуемого ряда динамики. Ясно, что остаточную сумму квадратов кусочно-линейной модели можно найти как сумму соответствующих сумм квадратов для обеих линейных компонент модели. Сумма числа степеней свободы этих компонент дает число степеней свободы всей модели в целом. Тогда сокращение остаточной дисперсии при переходе от единого уравнения тренда к кусочно-линейной модели — это просто остаточная сумма квадратов, из которой вычтены соответствующие суммы для обеих компонент кусочно-линейной модели. Столь же просто определяется и соответствующее число степеней свободы.

После этого рассчитывается фактическое значение F-критерия по дисперсиям на одну степень свободы. Это значение сравнивают с табличным, полученным по таблицам распределения Фишера для требуемого уровня значимости и соответствующего числа степеней свободы. Как всегда, если расчетное (фактическое) значение больше табличного (критического), то гипотеза о структурной стабильности (незначимости структурных изменений) отклоняется. Влияние же структурных изменений на динамику изучаемого показателя признается значимым. Таким образом, следует моделировать тенденцию ряда динамики с помощью кусочно-линейной модели. Если же расчетное значение меньше критического, то нельзя отклонять нуль-гипотезу без риска сделать неверный вывод. В этом случае следует использовать единое для всей совокупности уравнение регрессии как наиболее достоверное и минимизирующее вероятность ошибки.

6. Проверка остаточных величин на автокорреляцию

7. Способы исключения автокорреляции

Заключение

При изучении развития явления во времени часто возникает необходимость оценить степень взаимосвязи в изменениях уровней нескольких рядов динамики.
Применение методов классической теории корреляции (рассмотренных в предыдущих вопросах темы) связано с определенными особенностями:
1) в рядах динамики зачастую наблюдается зависимость между последующими и предшествующими уровнями. Наличие такой связи в статистической литературе называют автокорреляцией. При изучении взаимосвязи между рядами динамики с применением методов корреляционно-регрессионного анализа автокорреляция должна быть исключена из каждого из сравниваемых рядов динамики;
2) в изменении уровней нескольких рядов динамики, как правило, существует лаг, т.е. смещение во времени по сравнению с изменением уровней другого ряда динамики. Для получения более правильной оценки степени тесноты корреляционной связи также необходимо исключить этот лаг, т.е. нужно сдвинуть уровни одного ряда относительно другого на некоторый промежуток времени;
3) условия формирования уровней рассматриваемых рядов, как правило, изменяются. Эти изменения могут быть и существенными. Соответственно может изменяться во времени и степень тесноты связи. В этих условиях речь идет о переменной корреляции.
Таким образом, при анализе корреляционной связи между рядами динамики необходимо: 1) измерить связь между предыдущими и последующими уровнями; 2) с учетом указанных выше особенностей изучить связь между рядами динамики.
Первая задача решается по каждому ряду динамики: в качестве факторного признака рассматриваются фактические уровни ряда, а уровни этого же ряда со сдвигом на один период принимаются в качестве результативного признака. Исчисляются коэффициенты автокорреляции и авторегрессии. При этом коэффициент автокорреляции рассчитывается на основе формулы коэффициента линейной (парной) корреляции.
Если результаты расчета коэффициентов автокорреляции будут указывать на наличие автокорреляции уровней исходных рядов динамики, то для дальнейшего анализа корреляционной связи между рядами динамики нужно исключить эту автокорреляцию.
Имеется несколько способов исключения автокорреляции. Первый способ состоит в исключении от фактических уровней тренда (т.е. «выравненного» ряда). По каждому показателю времени находится отклонение фактического уровня от расчетного (сглаженного, выравненного). Т.е. коррелируют отклонения. Как показатель тесноты связи между изучаемыми рядами динамики используется коэффициент корреляции отклонений.

Список использованной литературы:

1. Общая теория статистики: Учебник/ Под ред. И. И. Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика, 2004. – 656 с.: ил.

2. Статистика: Гусаров В.М., Учеб. пособие для вузов. — М.: ЮНИТИ-ДАНА,
2003. - 463 с.

3. 3. Свободная энциклопедия W ikipedia http://ru.wikipedia.org

4. 4. Эрудиция – российская электронная энциклопедия, лекции по статистике http://www.erudition.ru

5. 5. Tarefer – лекции: курс лекций по статистике http://works.tarefer.ru

ОТКРЫТЬ САМ ДОКУМЕНТ В НОВОМ ОКНЕ

Комментариев на модерации: 1.

ДОБАВИТЬ КОММЕНТАРИЙ [можно без регистрации]

Ваше имя:

Комментарий