Смекни!
smekni.com

Анализ статистической совокупности (стр. 1 из 2)

Задача статистического исследования – освоить методику анализа структуры статистической совокупности с использованием компьютерных средств экономико-статистических расчетов, научится использовать аналитические группировки в выявлении взаимосвязей между явлениями.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Таблица П1

Исходные данные

Порядковый номер единицы наблюдения Среднегодовая стоимость основных средств, млн руб. Выручка от продаж продукции, млн руб.
1 94 110
2 107 101
3 134 120
4 158 84
5 163 80
6 167 114
7 173 161
8 173 90
9 177 178
10 179 107
11 200 125
12 201 108
13 205 133
14 237 180
15 212 201
16 213 161
17 214 151
18 216 169
19 218 149
20 230 180
21 234 148
22 237 162
23 241 166
24 169 121
25 45 224
26 276 171
27 290 191
28 298 220
29 167 114
30 205 133
31 330 53
32 260 224

РЕЗУЛЬТАТИВНЫЕ ТАБЛИЦЫ И ГРАФИКИ

Диаграмма 1

Аномальные значения признаков на диаграмме рассеяния

Таблица 2

Аномальные единицы наблюдения

Номер предприятия Среднегодовая стоимость
основных производственных
фондов, млн руб.
Выпуск продукции,
млн руб.
25 45 224
31 330 53

Таблица 3

Описательные статистики

Среднегодовая стоимость основных средств, млн руб. Выручка от продаж продукции, млн руб.
Столбец 1 Столбец 2
Среднее 205,3103448 Среднее 146,2758621
Стандартная ошибка 8,273511571 Стандартная ошибка 7,251277542
Медиана 205 Медиана 149
Мода 167 Мода 114
Стандартное отклонение 44,55422334 Стандартное отклонение 39,04932463
Дисперсия выборки 1985,078818 Дисперсия выборки 1524,849754
Эксцесс 0,027595777 Эксцесс -0,686034479
Асимметричность 0,134309755 Асимметричность 0,15523623
Интервал 191 Интервал 144
Минимум 107 Минимум 80
Максимум 298 Максимум 224
Сумма 5954 Сумма 4242
Счет 29 Счет 29
Уровень надежности(95,4%) 17,2763084 Уровень надежности(95,4%) 15,14173347

Таблица 4,а

Предельные ошибки выборки

Среднегодовая стоимость основных средств, млн руб. Выручка от продаж продукции, млн руб.
Столбец 2 Столбец 2
Уровень надежности(68,3%) 8,429419969 Уровень надежности(68,3%) 7,387922672

Таблица 4,б

Предельные ошибки выборки

Среднегодовая стоимость основных средств, млн руб. Выручка от продаж продукции, млн руб.
Столбец 1 Столбец 2
Уровень надежности(99,7%) 26,88832532 Уровень надежности(99,7%) 23,56613728

Таблица 5

Выборочные показатели вариации и асимметрии

Среднегодовая стоимость основных средств, млн руб. Выручка от продаж продукции, млн руб.
Стандартное отклонение 47,4549611 Стандартное отклонение 38,28309752
Дисперсия 2251,973333 Дисперсия 1465,595556
Среднее линейное отклонение 37,36 Среднее линейное отклонение 32,72888889
Коэффициент вариации, % 23,1137701 Коэффициент вариации, % 26,17184885
Коэффициент асимметрии 0,807299046 Коэффициент асимметрии 0,843083872

Таблица 6

Выходная таблица инструмента ГИСТОГРАММА

Карман Частота
1
134,8 2
175,6 7
216,4 10
257,2 6
298 4

Таблица 7

Интервальный ряд распределения предприятий по стоимости основных производственных фондов

Группы предприятий по среднесписочной численности работников, чел. Число предприятий в группе Накопительная частотность группы
94 - 134,8 3 10,00%
134,8 - 175,6 7 33,33%
175,6 - 216,4 10 66,67%
216,4 - 257,2 6 86,67%
257,2 - 298 4 100,00%
Итого 0 100,00%

Диаграмма 2

Анализ выборочной совокупности.

Задача 1.

На построенной диаграмме рассеяния (см. Диаграмма 1) визуально видно наличие аномальных точек. Это предприятие №25 (среднегодовая стоимость основных производственных фондов – 45 млн руб.; выпуск продукции – 224 млн руб.) и предприятие №31 (среднегодовая стоимость основных производственных фондов – 330 млн руб.; выпуск продукции – 53 млн руб.). Исключим аномальные единицы наблюдения из первичных данных. Внесем аномальные единицы наблюдения в таблицу 2.

Задача 2.

На основе имеющихся данных составим таблицу

Таблица 8

Описательные статистики выборочной совокупности

Среднегодовая стоимость
основных производственных
фондов, млн руб.
Выпуск продукции,
млн руб.
Столбец1 Столбец2
Среднее, Ч̃ 199,6333333 Среднее, Ч̃ 143,1666667
Медиана, Me 205 Медиана, Me 148,5
Мода,Mo 167 Мода,Mo 114
Интервал, R 204 Интервал, R 140
Стандартное отклонение, σn 46,04815113 Стандартное отклонение, σn 34,06179026
Дисперсия, σn2 2120,432222 Дисперсия, σn2 1160,205556
Среднее линейное отклонение, d 35,44 Среднее линейное отклонение, d 28,42222222
Коэффициент вариации, %, Vσ 23,0663639 Коэффициент вариации, %, Vσ 23,79170449
Коэффициент асимметрии, AsП 0,708678471 Коэффициент асимметрии, AsП 0,856286955

В таблицу внесены обобщающие статистические показатели совокупности, исчисляемые на основе анализа вариационных рядов распределения

Задача 3.

3,а. Если величина Vσудовлетворяет условию0%<Vσ≤40%, то степень колеблемости незначительна. В данной совокупности выполняется это условие.

0%<23,0663639≤40%

0%<23,79170449≤40%

3,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными.

3,в. Если

, то значения признака неустойчивы. В них имеются «аномальные» выбросы.

Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдения при выполнении задания 1, некоторые аномалии в первичных данных продолжают сохраняться.

Аномалии следует выявить и удалить из выборки.

3,г.

Обобщим данные и составим таблицу

Таблица 9

Распределение значений признака по диапазонам рассеяния признака относительно

Границы диапазонов Количество значений xi, находящихся в диапазоне
Первый признак Второй признак Первый признак Второй признак
153,5851822≤xi≤ 245,6814844 109,1048764≤xi≤177,228457 23/76,7% 21/65,6%
107,537031≤xi≤ 291,7296356 75,04308618≤xi≤211,2902472 28/87,5% 29/90,6%
61,48887991≤xi≤ 337,7777867 40,98129592≤xi≤245,3520375 31/96,9% 32/100%

Согласно вероятностной теореме П.Л. Чебышева, следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в диапазоне (

), а 89% значений – в диапазоне (
)

В нормально распределенных и близких к ним рядах вероятные оценки диапазонов рассеяния значений признака таковы: