Статистический анализ динамики услуг в районе (стр. 14 из 15)

По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у признаков фактора х1, чем признаков факторов х2, х3.

Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением заработной платы работников на 1 руб. объём платных услуг на душу населения увеличится на 1,6% , при условии, что другие факторы остаются постоянными.

Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением численности работников на 1 человека объём платных услуг на душу населения уменьшится на 0,1%, при условии, что другие факторы остаются постоянными.

Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличится на 0,4%, при условии, что другие факторы остаются постоянными.

3. Оценим с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

Оценку надежности уравнения регрессии в целом и показатели тесноты связи дает F-критерий Фишера:

Для проверки значимости уравнения выдвигаем две гипотезы:

H₀: уравнение регрессии является статистически не значимым.

H₁: уравнение регрессии является статистически значимым.

Таблица 3.3 – Дисперсионный анализ данных

df	SS	MS	F	Значимость F
Регрессия	3	5,78E+08	1,93E+08	75,35834	3,69E-17
Остаток	43	1,1E+08	2554841
Итого	46	6,87E+08

По данным таблицы дисперсионного анализа F_факт.=75,36. Вероятность случайно получить такое значение F-критерия составляет 3,69Е-17, что не превышает допустимый уровень значимости 5 %, об этом свидетельствует величина P- значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

4. Оценим статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента.

Выдвигаем две гипотезы:

H₀: коэффициенты регрессии является статистически не значимыми, т.е. равны 0.

H₁: коэффициенты регрессии является статистически значимыми, т.е. отличны от 0.

Таблица 3.4 – Результаты регрессионного анализа факторов Х_1,Х_2, Х₃

Стандартная ошибка	t-статистика
Y-пересечение	761,5746	-5,87325
Заработная плата работников, Х1	0,134205	10,2373
Численность работников, X2	0,022423	-1,82499
Оборот розничной торговли на душу населения, Х3	0,046465	3,297959

Значения случайных ошибок параметров b₁, b₂, b₃ c учетом округления (таблица 3.4):

Если значения t-критерия больше 2,09, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин.

параметр b статистически значим;

параметр b статистически не значим;

параметр b статистически значим.

5. Оценим качество уравнения через среднюю ошибку аппроксимации.

Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:

Но для этого еще найдем:

Получим:

Таким образом, фактические значения результативного признака отличаются от теоретических значений на 33,1 %. Следовательно, построенная модель является удовлетворительной.

6. Рассчитаем матрицу парных коэффициентов корреляции и отберем информативные факторы в модели. Укажем коллинеарные факторы.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Таблица 3.5 – Матрица коэффициентов парной корреляции

Y	Х1	X2	Х3
Y	1
Х1	0,886194	1
X2	0,590571	0,553515	1
Х3	0,670447	0,564597	0,903082	1

Из таблицы 3.5 можно заметить, что факторы x2 и x3 мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: x1 и x3.

7. Построим модель в естественной форме только с информативными факторами и оценим ее параметры:

Построим уравнение множественной линейной регрессии следующего вида:

Коэффициенты возьмём из таблицы 3.6:

Таблица 3.6 – Результаты регрессионного анализа факторов Х_1,Х_3,

Коэффициенты
Y-пересечение	-3832,012418
Заработная плата работников, Х1	1,343748976
Оборот розничной торговли на душу населения, Х3	0,080386804

Получаем уравнение следующего вида:

Оно показывает, что при увеличении заработной платы работников на 1 руб. объём платных услуг на душу населения увеличивается на 1,34 руб., при увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличивается на 0,08 руб.

Уравнение в целом, а также его параметры являются статистически значимыми.

8. Построим модель в стандартизированном масштабе и проинтерпретируем её параметры.

Уравнение в стандартизированном масштабе имеет вид:

Расчет β – коэффициентов выполним по формулам:

Парные коэффициенты корреляции берутся из матрицы (таблица 3.7).

Таблица 3.7 – Матрица коэффициентов парной корреляции

Стандартизированные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на одну сигму при неизменном уровне других факторов.

В нашем случае, при увеличении заработной платы работников на 1 сигму объём платных услуг населению увеличится на 1,17 сигм, при условии что оборот розничной торговли на душу населения остаётся на прежнем уровне. При увеличении оборота розничной торговли на душу населения на 1 сигму объём платных услуг населению увеличится на 0,39 сигм, при условии, что уровень заработной платы остаётся прежним.

На основании проделанной работы можно сделать вывод о том, что наиболее значимыми факторами являются заработная плата работников и оборот розничной торговли на душу населения, по ним мы и построили уравнение регрессии вида:

Рассчитаем доверительные интервалы для параметров уравнения регрессии по формулам:

;

Тогда:

Таким образом, при увеличении заработной платы работников на 1 руб. объём платных услуг населению будет колебаться от 1,07 до 1,61 руб. При увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг населению будет колебаться от 0,03 до 0,13 руб.

В качестве показателя тесноты связи выступает множественный коэффициент корреляции, который в нашем случае R=0,91, такое высокое значение говорит о том, что связь между результативным и факторными признаками тесная (сильная).

Для оценки качества подбора линейной функции используется R², который называется коэффициентом детерминации. Он характеризует долю дисперсии результативного признака, обусловленную влиянием данных факторов. В нашем случае R²=0,83, это означает, что доля влияния факторных признаков достаточно велика. Следовательно, доля влияния прочих факторов составляет 0,17. Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов. Наша модель имеет хорошее качество, поэтому ею мы воспользуемся для прогнозирования результативного признака (объёма платных услуг населению).

3.2 Прогнозирование среднедушевого объёма платных услуг

Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Рассчитаем ожидаемое прогнозное значение объёма платных услуг на душу населения как точечный прогноз путём подстановки в уравнение регрессии прогнозные значения факторов:

найдём из таблицы 3.8 максимальное значение для фактора х1: =11888
найдём из таблицы 3.8 максимальное значение для фактора х3: =84254

Таблица 3.8– Результат применения инструмента Описательная статистика

Y	X1	X3
Среднее	4876,374468	Среднее	5682,511	Среднее	13341,98
Стандартная ошибка	563,8853418	Стандартная ошибка	312,7184	Стандартная ошибка	1751,568
Медиана	2975,5	Медиана	5033	Медиана	10088
Мода	#Н/Д	Мода	#Н/Д	Мода	#Н/Д
Стандартное отклонение	3865,803138	Стандартное отклонение	2143,889	Стандартное отклонение	12008,14
Дисперсия выборки	14944433,9	Дисперсия выборки	4596262	Дисперсия выборки	1,44E+08
Эксцесс	0,22325654	Эксцесс	0,717807	Эксцесс	27,09227
Асимметричность	1,214182356	Асимметричность	1,094926	Асимметричность	4,714512
Интервал	14582,6	Интервал	9197	Интервал	80166
Минимум	480,5	Минимум	2691	Минимум	4088
Максимум	15063,1	Максимум	11888	Максимум	84254
Сумма	229189,6	Сумма	267078	Сумма	627073
Счет	47	Счет	47	Счет	47

найдём прогнозные значения факторов:

для фактора х1: х_пр=0,8*11888=9510