Смекни!
smekni.com

Основные понятия статистики (стр. 4 из 12)

При использовании второго способа вначале определяется дисперсия отклонений по формулам

простая; (1.24)

взвешенная. (1.25)

Дисперсия альтернативного признака (т.е. имеющего две взаимоисключающие разновидности, например, пол человека – мужской или женский, качество продукции – годная или бракованная) определяется по формуле 1.25, если вместо Xi подставить 1 и 0 (так как признак может принимать только 2 значения). Зная, что:

p + q = 1,

где p – доля единиц, обладающих признаком, q – доля единиц не обладающих им.

Среднее значение можно найти по формуле (1.14):

.

Таким образом получим формулу дисперсии альтернативного признака, применив формулу (1.25):

.

Таким образом, дисперсия альтернативного признака равна

. (1.26)

Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при p = q = 0,5.

В отличие от математики статистика оперирует не абстрактными, а смысловыми величинами, имеющими размерность. Поэтому и дисперсия здесь не безразмерная, как в математике, а сопровождается квадратической размерностью. Например, если статистическая величина измеряется в годах, или рублях, то дисперсия отклонений получится в «квадратных» годах или в «квадратных» рублях.

Для получения обычной размерности находится среднее квадратическое отклонение («сигма») как корень квадратный из дисперсии. То есть

=
. (1.27)

Однако значения средних отклонений, как любой абсолютной величины, служат лишь количественной мерой анализа статистической совокупности. Для качественного анализа применяются относительные критерии, называемые коэффициентами вариации.

2.7 Коэффициенты вариации

Вариация — это несовпадение значений одной и той же статистической величины у разных объектов в силу особенностей их собственного развития, а также различия условий, в которых они находятся. Вариация имеет объективный характер и помогает познать сущность изучаемого явления. Если средняя величина сглаживает индивидуальные различия, то вариация, наоборот, их подчеркивает, устанавливая типичность или не типичность найденной средней величины для конкретной статистической совокупности. Тем самым можно делать вывод о качественности подобранных статистических данных.

Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине.

Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации. Следовательно, коэффициенты вариации надо определять по формулам

линейный; (1.28)

квадратический. (1.29)

Значения коэффициента вариации изменяются от 0 до 1 и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. При этом критериальным значением коэффициента вариации служит 1/3.

То есть средняя величина считается типичной для данной совокупности при λ

0,333 или при ν
0,333. В ином случае средняя величина не типична и требуется пересмотреть статистическую совокупность с целью включения в нее более объективных статистических величин.

Обычно квадратический коэффициент вариации несколько (примерно на 25%) больше линейного, рассчитанные по одним и тем же данным. А значит возможен случай, когда λ

0,333 и ν
0,333, тогда необходимо взять среднюю из этих коэффициентов и по ее значению сделать окончательный вывод о не/типичности найденной средней величины.

С помощью линейного коэффициента вариации принципиальный вывод о типичности или не типичности средней величины можно получить проще и быстрее, чем с помощью квадратического. Однако квадратический коэффициент применяется чаще, так как существует несколько способов для вычисления дисперсии.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со стандартным отклонением σ = 10 лет, «состарилась» еще на 15 лет. Теперь

= 30 лет, а стандартное отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15*100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30*100 = 33,3 %).

Поэтому возможен дополнительный анализ статистической совокупности с помощью коэффициента осцилляции, определяемого по формуле

, (1.30)

где R — размах вариации в виде разности наибольшего и наименьшего значений в совокупности статистических величин. То есть

R = Хмах –Хmin, (1.31)

где Xмax и Xmin — максимальное и минимальное значения в совокупности.

При упорядочении статистических величин в совокупности образуются группировочные интервалы. Тогда под обозначением ∆Х понимается размах интервала, а среднее интервальное значение обозначается ХИ.

В случае ориентировки только на квадратический коэффициент вариации могут применяться разные методы определения дисперсии.

2.8 Определение дисперсии методом моментов

Преобразованием приведенных выше логических формул определения дисперсии могут быть получены ее новые формулы для расчета, например, методом моментов, которым иногда значение дисперсии получается быстрее.


=
=
=

Окончательно записываем, что дисперсия методом моментов определяется по формуле

Д =

, (1.32)

где

– средняя квадратов статистических величин;
– квадрат их средней величины.

Эти параметры нередко имеют и другие названия. Вычитаемое называют начальным моментом первого порядка, уменьшаемое – начальным моментом второго порядка, а сама дисперсия при этом называется центральным моментом второго порядка.

Для иллюстрации пользования формулами дисперсии рассмотрим простейший пример, приняв абстрактно Х1 = 2, Х2 = 4, Х3 = 6, для которых среднее значение, очевидно, равняется

= 4. Тогда дисперсия простая по логической формуле (1.24) будет равна

Д3 = ((2-4)2 + (4-4)2 + (6-4)2)/3 = 8/3 = 2,67

Применив формулу моментов (1.32), получим тот же результат

Д3 =(22 + 42 + 6 2 )/3 – 42 = 56/3 – 16 = 2,67

В данном примере быстрота определения дисперсии методом моментов не достаточно ощутима, но она проявляется очень заметно при большом количестве статистических данных.

2.9 Свойства средней арифметической и дисперсии

В статистических расчетах эти характеристики статистической совокупности зачастую применяются во взаимодействии. При этом с целью приведения их к удобному для анализа виду при громоздких значениях статистических величин используют следующие свойства.

1. Если каждую статистическую величину изменить на одно число (прибавить или отнять), то средняя арифметическая изменится на это число, а дисперсия при этом не изменится.

2. Если каждую статистическую величину изменить в одинаковое число раз (умножить или разделить), то средняя арифметическая изменится во столько же раз, а дисперсия изменится в квадрат таких раз.

Доказать эти свойства можно путем математических преобразований соответствующих формул, но гораздо проще доказательство получается с помощью следующего численного примера.

Принимая предыдущие три статистические величины с их значениями 2, 4, и 6, сначала прибавим к каждой из них 5, а потом умножим каждую из них на 5. Тогда получим измененные значения статистических величин, представленные матрицей

X1=2; X1’=2+5=7; X1’’=2*5=10.

X2=4; X2’=4+5=9; X2’’=4*5=10.

X3=6; X3’=6+5=11; X3’’=6*5=30.