Смекни!
smekni.com

Теория вероятностей (стр. 5 из 7)

1. -1<=Кxh<=1

Если Кxh =±1, то линейная зависимость между x и h и они не СВ.

2. Кxh>0, то с ростом одной составляющей, вторая также в среднем растет.

Кxh<0, то с убыванием одной составляющей, вторая в среднем убывает.

3. D(x±h)=D(x)+D(h)±2mxh

Доказательство.

D(x±h)=M((x±h)2)—M2(x±h)=M(x2±2xh+h2)—(M(x)±M(h))2=M(x2)±2M(xh)+M(h2)—+M2(x)+2M(x)*M(h)—M2(h)=D(x)+D(h)±2(M(xh))—M(x)*M(h)=D(x)+D(h)±2mxh

Вопрос 31

Мат. статистика опирается на теорию вероятностей, и ее цель – оценить характеристики генеральной совокупности по выборочным данным. Генеральной совокупностью называется вероятностное пространство {омега,S,P} (т.е. пространство элементарных событий омега с заданным на нем полем событий S и вероятностями Р) и определенная на этом пространстве С.В. Х. Случайной выборкой или просто выборкой объема n называется последовательность Х1,Х2,…,Xn, n независимых одинаково распределенных С.В., распределение каждой из которых совпадает с распределением исследуемой С.В. Х. Иными словами, случайная выборка – это результат n последовательных и независимых наблюдений над С.В. Х, представляющей генеральную совокупность.

Вопрос 32

Расположив элементы выборки в порядке неубывания, получим вариационный ряд х1 х2, ...-, хп. Если в вариационном ряду есть повто­ряющиеся элементы, то выборку можно записать в виде статисти­ческого ряда распределения, т.е. в виде таблицы

в которой хi'; (i= 1, 2,..., к) — это варианты (расположенные по возра­станию различные элементы выборки), а

отвечающие этим значениям частости (здесь mi — частота вариан­ты х'i, т.е. количество ее появлений в выборке). При этом, очевидно,

Кривая распределения частости - это ломаная с вершина­ми (х’i; Pi).

Выборочное среднее (4.1.1) и выборочную дисперсию (4.1.8) при этом можно вычислить по формулам

Для непрерывных случайных величин при достаточно боль­ших объемах выборки п вместо статистического ряда распределения используют интервальный вариационный ряд

где v - число интервалов одинаковой ширины h = (xn-x1)/(1+3,322lgn)1 и хп - соответственно минимальный и максимальный элементы выборки; зна­чение hрассчитывается с числом знаков после запятой, на единицу большим, чем в исходныхданных). Границы интервалов [aj, aj+i) рас­считываются по правилу: a1=x1-h/2, а2 = а1 + h, а3 = а2 + h, ...;

формирование интервалов заканчивается, как только для конца av+1 очередного интервала выполняется условие av+1 > хп. Выборочная ча-

стость

где miчисло вариант, попавших в i-й интервал

(i=1,2, ...,v). Выборочным аналогом плотности распределения fx(x) случайной величины X служит выборочная плотность распределения

Вопрос 33

Выборочным аналогом плотности распределения fx(x) случайной величины Xслужит выборочная плотность распределения

при х Î[ai; ai+1) (i= 1, 2,..., V), ее график называется гис­
тограммой, а ломаная с вершинами в точках
где через
х’=(
ai+ai+1)/2 обозначены середины интервалов, — полигоном частот.

Выборочное среднее и выборочную дисперсию при этом вычисляют по формулам (4.2.1), (4.2.2)

соответственно, в которых к = v.

По выборочной плотности распределения легко построить выборочную функцию распределения, при

этом линия, соединяющая точки

называется кумулятой

Гистограмма (тонкая линия), полигон частот (полужирная линия) (а) и кумулята (б)

Вопрос 34

Вопрос 35

Прежде всего, от оценки θn хотелось бы требовать, чтобы по мере роста числа наблюдений п она стремилась к оцениваемому параметру, т.е. чтобы для любого сколь угодно малого £>0 было справедли­во предельное равенство

Также от «хорошей» оценки естественно требовать, чтобы она не содержала систематической ошибки, т.е. при любом фиксирован­ном объеме выборки результат осреднения по всем возможным вы­боркам данного объема должен приводить к точному значению па­раметра:

Наконец, от оценки θn желательно требовать, чтобы она была наиболее точной в некотором классе оценок в, т.е. имела минималь­ную дисперсию:

Вопрос 36

Статистической оценкой - * неизвестного параметра - теоретического распределения называют функцию f(X1,X2,…,Xn) от наблюдаемых С.В. X1,X2,…,Xn. Точечной называют статистическую оценку, которая определяется одним числом - *=f(x1,x2,…,xn), где х1,х2,…,xn – результаты n наблюдений над количественным признаком Х (выборка). Несмещенной называют точечную оценку, мат. ожидание которой равно оцениваемому параметру при любом объеме выборки. Смещенной называют точечную оценку, мат. ожидание которой не равно оцениваемому параметру. Несмещенной оценкой генеральной средней ат. ожидания) служит выборочная средняя: Хв=(сумма по i от 1 до knixi)/n, где xi – варианта выборки, ni – частота варианты xi, n=сумма по i от 1 до kni – объем выборки.

Вопрос 37

Вопрос38

Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка. Если распределение определяется одним параметром, то для его отыскания приравнивают один теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка: v1=M1. Учитывая, что v1=M(X) и М1=Хв, получим М(Х)=Хв. Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка. Учитывая, что v1=M(X),M1=Хв,мю=D(X),m2=Dв, имеем систему: М(Х)=Хв, D(X)=Dв.

Метод наибольшего правдоподобия точечной оценки неизвестных параметров заданного распределения сводится к отысканию максимума функции одного или нескольких оцениваемых параметров. Д.С.В. Пусть Х – Д.С.В., которая в результате n опытов приняла возможные значения х1,х2,…,xn. Допустим, что вид закона распределения величины Х задан, но неизвестен параметр -, которым определяется этот закон; требуется найти его точечную оценку -*=- (x1,x2,…,xn). Обозначим вероятность того, что в результате испытания величина Х примет значение xi через р(xi;-). Функцией правдоподобия Д.С.В. Х называют функцию аргумента -: L (x1,x2,…,xn;-)=p(x1;-)*p(x2;-)…p(xn;-). Оценкой наибольшего правдоподобия параметра - называют такое его значение -*, при котором функция правдоподобия достигает максимума. Функции L и lnL достигают максимума при одном и том же значении -, поэтому вместо отыскания максимума функции L ищут, что удобнее, максимум функции lnL. Н.С.В. Пусть Х – Н.С.В., которая в результате n испытаний приняла значения х1,х2,…,xn. Допустим, что вид плотности распределения – функции f(x) – задан, но неизвестен параметр -, которым определяется эта функция. Функцией правдоподобия Н.С.В. Х называют функцию аргумента -: L(x1,x2,…,xn;-)=f(x1;-)*f(x2;-)…f(xn;-).

Вопрос 39

Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр. Доверительный интервал – это интервал, который с заданной надежностью гамма покрывает заданный параметр

Интервальной оценкой (с надежностью гамма) среднего квадратического отклонения сигма нормально распределенного количественного признака Х по «исправленному» выборочному среднему квадратическому отклонению s служит доверительный интервал s(1-q)<сигма<s(1+q), при q<1; 0<сигма<s(1+q), при q>1. 3. Интервальной оценкой ( с надежностью гамма) неизвестной вероятности р биномиального распределения по относительной частоте w служит доверительный интервал ( с приближенными концами р1 и р2).