Смекни!
smekni.com

Статистический анализ динамики услуг в районе (стр. 14 из 15)

По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у признаков фактора х1, чем признаков факторов х2, х3.

Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением заработной платы работников на 1 руб. объём платных услуг на душу населения увеличится на 1,6% , при условии, что другие факторы остаются постоянными.

Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением численности работников на 1 человека объём платных услуг на душу населения уменьшится на 0,1%, при условии, что другие факторы остаются постоянными.

Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличится на 0,4%, при условии, что другие факторы остаются постоянными.

3. Оценим с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

Оценку надежности уравнения регрессии в целом и показатели тесноты связи дает F-критерий Фишера:

Для проверки значимости уравнения выдвигаем две гипотезы:

H0: уравнение регрессии является статистически не значимым.

H1: уравнение регрессии является статистически значимым.

Таблица 3.3 – Дисперсионный анализ данных

df SS MS F Значимость F
Регрессия 3 5,78E+08 1,93E+08 75,35834 3,69E-17
Остаток 43 1,1E+08 2554841
Итого 46 6,87E+08

По данным таблицы дисперсионного анализа Fфакт. =75,36. Вероятность случайно получить такое значение F-критерия составляет 3,69Е-17, что не превышает допустимый уровень значимости 5 %, об этом свидетельствует величина P- значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

4. Оценим статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента.

Выдвигаем две гипотезы:

H0: коэффициенты регрессии является статистически не значимыми, т.е. равны 0.

H1: коэффициенты регрессии является статистически значимыми, т.е. отличны от 0.

Таблица 3.4 – Результаты регрессионного анализа факторов Х1, Х2, Х3

Стандартная ошибка t-статистика
Y-пересечение 761,5746 -5,87325
Заработная плата работников, Х1 0,134205 10,2373
Численность работников, X2 0,022423 -1,82499
Оборот розничной торговли на душу населения, Х3 0,046465 3,297959

Значения случайных ошибок параметров b1, b2, b3 c учетом округления (таблица 3.4):

Если значения t-критерия больше 2,09, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин.

параметр b статистически значим;

параметр b статистически не значим;

параметр b статистически значим.

5. Оценим качество уравнения через среднюю ошибку аппроксимации.

Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:

Но для этого еще найдем:

Получим:

Таким образом, фактические значения результативного признака отличаются от теоретических значений на 33,1 %. Следовательно, построенная модель является удовлетворительной.

6. Рассчитаем матрицу парных коэффициентов корреляции и отберем информативные факторы в модели. Укажем коллинеарные факторы.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Таблица 3.5 – Матрица коэффициентов парной корреляции

Y Х1 X2 Х3
Y 1
Х1 0,886194 1
X2 0,590571 0,553515 1
Х3 0,670447 0,564597 0,903082 1

Из таблицы 3.5 можно заметить, что факторы x2 и x3 мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: x1 и x3.

7. Построим модель в естественной форме только с информативными факторами и оценим ее параметры:

Построим уравнение множественной линейной регрессии следующего вида:

Коэффициенты возьмём из таблицы 3.6:

Таблица 3.6 – Результаты регрессионного анализа факторов Х1, Х3,

Коэффициенты
Y-пересечение -3832,012418
Заработная плата работников, Х1 1,343748976
Оборот розничной торговли на душу населения, Х3 0,080386804

Получаем уравнение следующего вида:

Оно показывает, что при увеличении заработной платы работников на 1 руб. объём платных услуг на душу населения увеличивается на 1,34 руб., при увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличивается на 0,08 руб.

Уравнение в целом, а также его параметры являются статистически значимыми.

8. Построим модель в стандартизированном масштабе и проинтерпретируем её параметры.

Уравнение в стандартизированном масштабе имеет вид:

Расчет β – коэффициентов выполним по формулам:

Парные коэффициенты корреляции берутся из матрицы (таблица 3.7).

Таблица 3.7 – Матрица коэффициентов парной корреляции

Стандартизированные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на одну сигму при неизменном уровне других факторов.

В нашем случае, при увеличении заработной платы работников на 1 сигму объём платных услуг населению увеличится на 1,17 сигм, при условии что оборот розничной торговли на душу населения остаётся на прежнем уровне. При увеличении оборота розничной торговли на душу населения на 1 сигму объём платных услуг населению увеличится на 0,39 сигм, при условии, что уровень заработной платы остаётся прежним.

На основании проделанной работы можно сделать вывод о том, что наиболее значимыми факторами являются заработная плата работников и оборот розничной торговли на душу населения, по ним мы и построили уравнение регрессии вида:

.

Рассчитаем доверительные интервалы для параметров уравнения регрессии по формулам:

;

;

Тогда:

Таким образом, при увеличении заработной платы работников на 1 руб. объём платных услуг населению будет колебаться от 1,07 до 1,61 руб. При увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг населению будет колебаться от 0,03 до 0,13 руб.

В качестве показателя тесноты связи выступает множественный коэффициент корреляции, который в нашем случае R=0,91, такое высокое значение говорит о том, что связь между результативным и факторными признаками тесная (сильная).

Для оценки качества подбора линейной функции используется R2, который называется коэффициентом детерминации. Он характеризует долю дисперсии результативного признака, обусловленную влиянием данных факторов. В нашем случае R2=0,83, это означает, что доля влияния факторных признаков достаточно велика. Следовательно, доля влияния прочих факторов составляет 0,17. Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов. Наша модель имеет хорошее качество, поэтому ею мы воспользуемся для прогнозирования результативного признака (объёма платных услуг населению).

3.2 Прогнозирование среднедушевого объёма платных услуг

Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Рассчитаем ожидаемое прогнозное значение объёма платных услуг на душу населения как точечный прогноз путём подстановки в уравнение регрессии прогнозные значения факторов:

  1. найдём из таблицы 3.8 максимальное значение для фактора х1: =11888
  2. найдём из таблицы 3.8 максимальное значение для фактора х3: =84254

Таблица 3.8– Результат применения инструмента Описательная статистика

Y X1 X3
Среднее 4876,374468 Среднее 5682,511 Среднее 13341,98
Стандартная ошибка 563,8853418 Стандартная ошибка 312,7184 Стандартная ошибка 1751,568
Медиана 2975,5 Медиана 5033 Медиана 10088
Мода #Н/Д Мода #Н/Д Мода #Н/Д
Стандартное отклонение 3865,803138 Стандартное отклонение 2143,889 Стандартное отклонение 12008,14
Дисперсия выборки 14944433,9 Дисперсия выборки 4596262 Дисперсия выборки 1,44E+08
Эксцесс 0,22325654 Эксцесс 0,717807 Эксцесс 27,09227
Асимметричность 1,214182356 Асимметричность 1,094926 Асимметричность 4,714512
Интервал 14582,6 Интервал 9197 Интервал 80166
Минимум 480,5 Минимум 2691 Минимум 4088
Максимум 15063,1 Максимум 11888 Максимум 84254
Сумма 229189,6 Сумма 267078 Сумма 627073
Счет 47 Счет 47 Счет 47
  1. найдём прогнозные значения факторов:

для фактора х1: хпр=0,8*11888=9510