Смекни!
smekni.com

Корреляционный анализ 3 (стр. 2 из 3)

в) Построение доверительных интервалов для коэфф. теор. ур-я регрессии.

г) Оценка качества модели в целом.

- коэфф. детерминации,
, чем ближе к 1, тем большее влияние оказ. факторы, включ. в модель.

Принимается гипотеза об отсутствии совместного влияния всех факторов на изменение

т.е.
. Проверка осущ. с помощью критерия Фишера:

, где
- число факторов.

Если

, то гипотеза отклоняется; все факторы оказывают опред. совместное влияние на изменение
.

Криволинейная корр. зависимость.

Линейный коэфф. корр. применять нельзя. Применяются корр. отношения.

, где
- групповая дисперсия,
- остаточная (межгрупповая) дисперсия,
- общая дисперсия.

, далее рассчитывается показатель
.
1 2 3 4
2 1 2 3
4 2 1 3
5 1 1
2 1 2 2 7

Пример. Дано:

,
.

,

,

,
- корр. отношение.

Проверка стат. значимости: критерий Фишера:

, где
- число группировок по
,
- число степ. свободы.

принимаем гипотезу о наличии корр. зависимости.

Способы построения модели регрессии.

Метод последовательного включения.

Все данные должны представлять случайную выборку.

На основе данных определяется корреляционная матрица:

, 1 столбец – показывает взаимосвязь со всеми факторами; 2, 3 – отражает межфакторные взаимодействия. Если межфакторный коэфф. больше 0,8, то это мультиколлинеарность – плохо.

По первому столбцу выбирается мах стат. значимый коэфф. регр-ии. Соответствующий фактор первым включается в модель (

).

Далее определяется 2 фактор. Вычисляется частный коэфф. корр. 1 порядка м/у

и всеми оставшимися факторами, за искл. уже включ. в модель.

. В модель включ. фактор
.

Далее вычисл. частный коэф. корр. II порядка при исключ. уже включ. факторов:

и т.д.

Каждый раз строятся модели, вычисл. t-статистики,

, F. Если добавление фактора в модель увеличивает
, то он считается полезным. В противном случае он считается вредным.

Метод последовательного исключения.

Применяется, если среди факторных переменных есть неслуч. переменные.

Сначала строится регесс. модель, включ. все факторные переменные. производится оценка коэфф. регрессии, для всех коэфф. опред. t-статистика. Если в построенной модели все

, то модель адекватна и по другим критериям. Построение модели заканчивается.

Если же для нескольких факторов

, то из модели исключ. фактор с наименьшим
. Перерасчитывается модель регрессии, снова производится оценка коэфф. – так до тех пор, пока не будет построена хорошая по стат. качествам модель.

Метод всех возможных регрессий.

Строятся модели с различным кол-вом факториальных признаков: от 1 до

во всех возможных сочетаниях, которые позволяет данный набор факторов. Все модели включ. в таблицу:
модель
F

Выбирается лучшая модель (все коэфф. значимы).

Временные ряды.

Метод среднего абсолютного отклонения.

Предназначен для прогнозирования на один год. Временной ряд

аппроксимируется функцией
:

,
,

,

, прогнозное значение показателя Х в году Т+1 есть F(T+1).

Точность аппроксимации характеризуют: средняя абсолютная погрешность

, средняя относительная погрешность
и среднеквадратическое отклонение S:

,
,
.

Практически хорошим качеством аппроксимации считается

в пределах 3-5%.