Смекни!
smekni.com

Группировка статистических данных (стр. 2 из 2)

3. Техника выполнения группировок.

Группировка, показывающая распределение элементов совокупности по какому-то одному признаку, называется рядом распределения. Если ряд распределения построен по признаку, имеющему качественное выражение, то он является вариационным рядом. Вариационные ряды бывают интервальными и дискретными.

Интервальный ряд содержит распределение совокупности явлений на группы, ограниченные определенными интервалами. (от – до).

Примером интервального ряда может быть распределение колхозов и совхозов на группы по урожайности сельскохозяйственных культур, по размерам валового дохода на 100 га пашни. Рассмотрим пример группировки по урожайности.

Таблица 1. Распределение колхозов района по урожайности.

Урожайность озимой

пшеницы с 1 га
Число колхозов Удельный вес в%
До 15 15-20 20-25 25-30 30 и выше 2 6 18 9 5 5,0 15,0 45,0 22,5 12,5
Итого 40 100

Предполагается, что группировочный признак может принимать любое значение в пределах каждого интервала.

Дискретный ряд отличается тем, что в нем группировочный признак не может принимать промежуточных значений. Примером такого ряда служит распределение магазинов по числу рабочих мест в них:

Число рабочих мест Число магазинов
1 2 3 6 85 140

Ясно, что группировочный признак не может иметь здесь дробных значений.

В таблице 2 представлены данные по использованию производственного оборудования, занятого в основном производстве на машиностроительных предприятиях.

Таблица 2.

Группы

Предприятий по кол-ву установл.ст.

Кол-во

Предпр
Кол-во установленного оборудования тыс.ед. Удельный вес работавшего оборудования% к установл Ксм работы оборудования
До 50 51-100 101-200 201-500 501-1000 1001-2000 2001 и выше

173

300 537 867 512 241 142
6,4 26,3 82,9 277,9 350,1 310,4 488 80 82 83 85 85 85 85 1,2 1,26 1,30 1,38 1,40 1,41 1,48

Как видно из таблицы 2, группы предприятий намечены с помощью неравных интервалов, т.е. интервалов, у которых разности между верхней и нижней границами неодинаковы в разных группах. Во второй группе – 50 ед., в третьей – 100, в четвертой – 300 и т.д., т.е. в приведенной группировке величина интервала постепенно увеличивается, а в последней группе верхняя граница не указывается совсем. Интервалы, в которых указана лишь одна граница (верхняя или нижняя), называются открытыми, остальные интервалы являются закрытыми.

Неравные интервалы применяются при группировках, которые охватывают массу единиц неоднородной совокупности с неравномерными и значительными колебаниями признака.

Внутри типичных групп для характеристики количественных различий единиц, составляющих соответствующую группу, могут быть применены равные интервалы. В этом случае величина интервала определяется делением размаха варьирования на принятое число групп.

Выше рассмотрены примеры группировок, произведенных на основе непосредственного обобщения первичных данных статистического наблюдения. Такие группировки можно назвать первичными. Однако на практике иногда приходится перегруппировать раннее сгруппированный материал для обеспечения сопоставимости данных двух или нескольких группировок, увеличения (укрупнения) или уменьшения интервалов и т.д. Такие группировки принято называть вторичными. Укрупнение интервалов – наиболее простой прием вторичной группировки.

Величина интервала i=()/h, где

hmax,hmin – максимальное и минимальное значение пизнака;

h – число групп, определяется по формуле Стэрджесса,

h=1+3,332ln(n), где n – число изучаемых единиц

совокупности.

4.Статистические таблицы, их виды и принципы построения.

Статистические таблицы являются средством оформления результатов сводки и группировки, а также анализа статистических данных. Статистические таблицы дают возможность представить результаты сводки и группировки в таком виде, который облегчает их чтение и анализ. Без статистических таблиц пришлось бы сопровождать каждый показатель громоздкими пояснениями, а с помощью статистических таблиц статистические материалы располагаются в определенном порядке, удобном для их сравнения между собой и для исчисления производных показателей. Чтобы соответствовать своему назначению, таблица должна быть по возможности небольшой, компактной, и, как говорят, удообозримой.

По форме таблица состоит из горизонтальных строк и вертикальных граф, пересечения которых образуют клетки, в которых размещаются показатели. Поэтому каждому показателю в таблице соответствует два заголовка: вверху – наименование граф, слева – наименование строк. Поскольку каждый заголовок вверху относится ко всем показателям данной графы, а каждый заголовок слева – ко всем показателям данной строки, то это дает возможность избежать повторения наименований и обозначений после каждого показателя.

По своему содержанию статистическая таблица напоминает грамматическое предложение: в ней приводятся наименования изучаемых явлений (о ком или о чем говорится в таблице) и показатели, характеризующие состояние или развитие этих явлений (что именно говорится об изучаемом явлении). Поэтому в статистических таблицах, как и в грамматическом предложении, принято выделять подлежащее и сказуемое.

Подлежащим таблицы является перечень явлений или их групп, которые характеризуются показателями таблицы. Например, в таблице «зависимость себестоимости молока от продуктивности коров», подлежащее – группы хозяйств по годовому надою. Сказуемым таблицы являются показатели, характеризующие подлежащее.

Таблица. Макет статистической таблицы.

Общий заголовок.
Сказуемое Подлежащее Верхние внутренние заголовки
А 1 2 3 4 5
Боковые заголовки
Итог

· Примечание к таблице (используется только тогда когда необходимо специально пояснить прием расчета, указать источник данных, оговорить специфический характер отдельных показателей.

Пример.

Группы хозяйств по годовому удою на корову, ц Число хозяйств в группе Среднегодовой надой на одну корову, ц Себестоимость 1ц молока, руб. Расход кормов на 1ц молока
До 40 40-50 45-50 свыше 50 в среднем 17 26 43 14 100 37,2 42,4 48,1 53,3 45,5 313 275 248 225 263 1,39 1,31 1,22 1,08 1,25

По характеру подлежащего различают таблицы трех видов: простые, групповые, комбинационные. Подлежащее простой таблицы представляет собой перечень изучаемых явлений:

Таблица. Показатели обеспеченности населения медицинской помощью на конец года.

Показатели 1940 1950 1960 1972
Численность врачей, всего Число врачей на 10000 человек населения Число больничных коек на 10000 человек населения 155,3 7,9 40,2 265 14,6 56,0 431,7 20 80,4 731,8 29,4 112,3

Таблица по своему построению является простой, так как в подлежащем ее нет группировки. Простые таблицы широко распространены в статистике, часто они недостаточны для анализа, поскольку не содержит группировки статистических данных.

Таблицы, которые содержат в подлежащем группировку, называются групповыми:

Таблица. Выпуск специалистов по отраслевым группам «Высших учебных заведений», тыс.чел.

Группы ВУЗов

1960 1972 1986
Промышленности и строительства Транспорта и связи Сельского хозяйства Экономики и права Здравоохранения, физкультуры и спорта Просвещения Искусства и кинематографии 95,2 16,1 34,7 25,0 30,7 139,1 2,5 250,4 31,2 59,6 54,5 53,3 227,6 7,7 510,5 64,1 120,3 104,1 132,3 478,5 12,2
Всего 343,3 684,3 1422,1

Еще больше возможностей для углубленного анализа статистического материала дают таблицы, содержащие результаты сложной группировки по двум или нескольким признакам. Такие таблицы называются комбинационными:

Таблица. Состав учащихся общеобразовательных школ на начало 1996/1997 учебного года.

Распределение учащихся по группам классов Численность учащихся, млн.

Из них

В городских поселениях В сельской местности
Млн. % Млн. %
1-3 4-8 9-10 итого 13,9 25,4 5,1 44,4 6,8 13,0 2,9 22,7 49 51 57 51 7,1 12,4 2,2 21,7 51 49 43 49

В приведенной таблице учащиеся общеобразовательных школ распределены на группы по двум признакам:

1. по группам классов;

2. по месту нахождения.

Число учащихся в городских поселениях больше, чем в сельской местности за счет учащихся старших классов. Число учащихся в 1-3 классах в сельской местности больше. Если бы группировка данных производилась по каждому признаку отдельно, этот факт мог остаться незамеченным.

Построению таблицы предшествует подбор макета для нее. Рекомендуется составить несколько макетов с целью выбора одного из них, в наибольшей мере соответствующего содержанию материала.

При составлении таблиц необходимо придерживаться следующих правил:

1. Таблица должна быть по возможности небольшой но размеру, включать только те данные которые необходимы для изучения данного явления. Такую таблицу проще читать и анализировать.

2. Общий заголовок, заголовки подлежащего и сказуемого должны формулироваться четко и коротко.

3. Если число показателей сказуемого велико, их необходимо пронумеровать. При этом графы, в которых содержится перечень объектов или групп обозначаются большими буквами алфавита, а графы с показателями сказуемого – арабскими цифрами.

4. Если нет сведений о размере явления, то в соответствующей клетке делается отметка «нет сведений» или ставятся точки (…). В случае невозможности заполнения какой-либо клетки, ввиду отсутствия соответствующего явления, делается прочерк (–).

5. Показатели каждой графы должны приводится с одинаковой степенью точности, т.е. до 1; 0,1; 0.01 и т.д.

6. Если приведенные показатели имеют различные единицы измерения, им выделяют специальную графу.

7. Таблицы должны быть замкнутыми, т.е. с итоговыми результатами.