ГЛАВА 2 . МОДЕЛИ РЕГРЕССИИ

2.1. Парная линейная регрессия

Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических процессов:

1. модели временных рядов,

2. регрессионные модели с одним уравнением,

3. системы одновременных уравнений.

Модель с одной объясняющей и одной объясняемой переменными – модель парной регрессии. Если объясняющих (факторных) переменных используется две или более, то говорят об использовании модели множественной регрессии. При этом, в качестве вариантов могут быть выбраны линейная, экспоненциальная, гиперболическая, показательная и другие виды функций, связывающие эти переменные.

Линейная регрессия представляет собой линейную функцию между условным математическим ожиданием

зависимой переменной Y и одной объясняющей переменной X:

где

- значения независимой переменной в i-ом наблюбдении, i=1,2,…,n. Принципиальной является линейность уравнения по параметрам

. Так как каждое индивидуальное значение

отклоняется от соответствующего условного математического ожидания, тогда вданную формулу необходимо ввести случайное слагаемое

, тогда получим:

Данное соотношение называется теоретической линейной регрессионной моделью, а

- теоретическими параметрами (теоретическими коэффициентами) регрессии,

- случайным отклонением. Следовательно, индивидуальные значения

представляются в виде суммы двух компонент – систематической

и случайной

[12]

Для определения значений теоретических коэффициентов регрессии необходимо знать и использовать все значения переменных Xи Y генеральной совокупности, что невозможно. задачи регрессионного линейного анализа состоят в том, чтобы по имеющимся статистическим данным (

), i=1,…,nдля переменных Xи Y:

1. получить наилучшие оценки неизвестных параметров

;

2. проверить статистические гипотезы о параметрах модели;

3. проверить, достаточно ли хорошо модель согласуется со статистическими данными.

Парная линейная регрессия - это причинная модель статистической связи линейной между двумя количественными переменными «x» и «у», представленная уравнением

, где х - переменная независимая, y - переменная зависимая. Коэффициент регрессии «b» и свободный член уравнения регрессии «a» вычисляются по формулам:

где r - коэффициент линейной корреляции Пирсона для переменных x и y; s_x и s_y - стандартные отклонения для переменных x и y; x,y - средние арифметические для переменных x и y.

Существуют два подхода к интерпретации коэффициента регрессии b. Согласно первому из них, b представляет собой величину, на которую изменяется предсказанное по модели значение ŷ_i = a + bx_i при увеличении значения независимой переменной x на одну единицу измерения, согласно второй - величину, на которую в среднем изменяется значение переменной y_i при увеличении независимой переменной x на единицу. На диаграмме рассеяния коэффициент b представляет тангенс угла наклона линии регрессии y = a + bx к оси абсцисс. Знак коэффициента регрессии совпадает со знаком коэффициента линейной корреляции: значение b>0 свидетельствует о прямой линейной связи, значение b < 0 - об обратной. Если b = 0, линейная связь между переменными отсутствует (линия регрессии параллельна оси абсцисс).

Свободный член уравнения регрессии a интерпретируется, если для независимой переменной значение x = 0 имеет смысл. В этом случае y = a, если x = 0. Качество (объясняющая способность) уравнения парной линейной регрессии оценивается с помощью коэффициента детерминации.

После построения уравнения регрессии необходима интерпретация и анализ, а также словесное описание полученных результатов с трактовкой найденных коэффициентов.

2.2. Множественная линейная регрессия

На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов. В этом случае вместо парной регрессии рассматривается множественная. В общем случае в регрессионный анализ вовлекаются несколько независимых переменных. Это, конечно же, наносит ущерб наглядности получаемых результатов, так как подобные множественные связи в конце концов становится невозможно представить графически. Переменные, объявленные независимыми, могут сами коррелировать между собой; этот факт необходимо обязательно учитывать при определении коэффициентов уравнения регрессии для того, чтобы избежать ложных корреляций.

Заданием множественного регрессионного анализа является построение такого уравнения прямой k-мерном пространстве, отклонение результатов наблюдений

от которой были бы минимальными. Используя для этого метод наименьших квадратов, получается система нормальных уравнений, которую можно представить и в матричной форме.

Множественная линейная регрессия - причинная модель статистической связи линейной между переменной зависимой y и переменными независимыми x₁,x₂,...,x_k, представленная уравнением y = b₁x₁ + b₂x₂ + ... + b_kx_k + a = ∑ b_ix_i + a . Коэффициенты b₁,b₂,...,b_k называются нестандартизированными коэффициентами, а - свободным членом уравнения регрессии. Уравнение регрессии существует также в стандартизированном виде, когда вместо исходных переменных используются их z-оценки: z_y = ∑ β_iz_i. Здесь z_y - z-оценка переменной у; z₁,z₂,...,z_k - z-оценки переменных x₁,x₂,...,x_k; β₁,β₂,...,β_k - стандартизированные коэффициенты регрессии (свободный член отсутствует).

Для того чтобы найти стандартизированные коэффициенты, необходимо решить систему линейных уравнений:

β₁ + r₁₂β₂ + r₁₃β₃ + ... + r_1kβ_k = r_1y,

r₂₁β₁ + β₂ + r₂₃β₃ + ... + r_2kβ_k = r_2y,

r₃₁β₁ + r₃₂β₂ + β₃ + ... + r_3kβ_k = r_3y,

...

r_k₁β₁ + r_k₂β₂ + r_k₃β₃ + ... + β_k = r_ky,

в которой r_ij - коэффициенты линейной корреляции Пирсона для переменных x_i и x_j; r_iy - коэффициент корреляции Пирсона для переменных x_i и y. [8]

Нестандартизированные коэффициенты регрессии вычисляются по формуле b_i = β_i ∙ s_y / s_i, где s_y - стандартное отклонение переменной y; s_i - стандартное отклонение переменной х_i. Свободный член уравнения регрессии находится по формуле a = y - ∑ b_ix_i, где y - среднее арифметическое переменной y, x_i - средние арифметические для переменных x_i.

В настоящее время используются два подхода к интерпретации нестандартизированных коэффициентов линейной регрессии b_i. Согласно первому из них, b_i представляет собой величину, на которую изменится предсказанное по модели значение ŷ = ∑ b_ix_i при увеличении значения независимой переменной x_i на единицу измерения; согласно второму - величину, на которую в среднем изменяется значение переменной y при увеличении независимой переменной x_i на единицу. Значения коэффициентов b_i существенно зависят от масштаба шкал, по которым измеряются переменные y и x_i, поэтому по ним нельзя судить о степени влияния независимых переменных на зависимую. Свободный член уравнения регрессии a равен предсказанному значению зависимой переменной ŷ в случае, когда все независимые переменные x_i = 0. [8]

Стандартизированные коэффициенты β_i являются показателями степени влияния независимых переменных x_i на зависимую переменную y. Они интерпретируются как "вклад" соответствующей независимой переменной в дисперсию (изменчивость) зависимой переменной.

Качество (объясняющая способность) уравнения множественной линейной регрессии измеряется коэффициентом множественной детерминации, который равен квадрату коэффициента корреляции множественной R².

Уравнение регрессии (стр. 2 из 3)

ГЛАВА 2 . МОДЕЛИ РЕГРЕССИИ

2.1. Парная линейная регрессия

2.2. Множественная линейная регрессия