Понятия и расчеты в математической статистике (стр. 1 из 2)

1. Какая шкала называется шкалой отношений? Приведите примеры

Шкала отношений или шкала равных отношений - наиболее часто используемая в естественных науках и, прежде всего, в физике. Это еще более гибкая шкала, здесь кроме определения равенства, рангового порядка, равенства интервалов известно еще и равенство отношений. Шкала отношений позволяет определить не только, на сколько больше (меньше) один объект другого в отношении измеряемого свойства, но и во сколько раз больше (меньше).

Например, для четырех объектов с откликами 3, 4, 6 и 8 выполняется отношение 3/4 = 6/8. Это обусловлено тем, что в шкала отношений в отличие от интервальной шкалы, нулевое значение отклика указывает на полное отсутствие измеряемого свойства.

2. Стратифицированная, или расслоенная, выборка

(stratifiedsampling) — это процесс, состоящий из двух этапов, в котором совокупность делится на подгруппы (слои, страты, strata). Слои должны взаимно исключать и взаимно дополнять один другого, чтобы каждый элемент совокупности относился к одному и только одному слою, и ни один элемент не был упущен. Далее, из каждого слоя случайным образом выбираются элементы, при этом обычно используется метод простой случайной выборки. Формально, выбор элементов из каждого слоя может осуществляться только с помощью SRS. Однако на практике иногда применяется систематический отбор и другие вероятностные выборочные методы. Отличие стратифицированной выборки от квотной состоит в том, что элементы в ней выбираются скорее случайно, а не из удобства или на основании мнения исследователя. Главная задача стратифицированной выборки — увеличение точности без увеличения затрат.

Стратификационный метод обеспечивает наличие в выборке всех важных подгрупп. Это особенно важно, если исследуемая характеристика неравномерно распределена среди элементов генеральной совокупности. Например, распределение дохода семей неравномерно, так как годовой доход большинства семей составляет меньше 50 тысяч долларов, и лишь немногие семьи имеют годовой доход, равный 125 тысяч долларов и выше. Если применить простую случайную выборку, семьи с доходом 125 тысяч долларов и выше могут не быть адекватно представлены. Стратифицированная выборка позволяет обеспечить соответствующее количество таких семей в выборке. Она сочетает в себе простоту метода SRS с возможностью повышения точности. Поэтому данный метод формирования выборки

3. Медиана

один из показателей центра распределения для порядковых и количественных переменных; обозначается Ме. Представляет собой значение переменной, которое делит выборку пополам таким образом, чтобы для 50% объектов из выборки значения переменной не превосходили Ме, а для других 50% объектов - были не меньше, чем Ме.

4. Охарактеризуйте понятие «мощность критерия»

Для определения понятия мощности критерия введем понятие альтернативной гипотезыH₁, т.е. гипотезы, которая выполняется, если не выполняется нулевая гипотеза H₀. Тогда в терминах правильности или ошибочности принятия H₀ и H₁можно указать четыре потенциально возможных результата применения критерия к выборке, представленные в табл. 3. Как мы видим мощность критерия - это вероятность принятия при применении данного критерия альтернативной гипотезы H₁при условии, что она верна. Очевидно, что при фиксированной ошибке 1-го рода (ее мы задаем сами, и она не зависит от свойств критерия) критерий будет тем лучше, чем больше его мощность (т.е. чем меньше ошибка 2-го рода).

Проведем следующие рассмотрения для того, чтобы формально определить понятие мощности критерия. Критерий разбивает выборочное пространство

на два дополнительных множества

( множество точек, для которых гипотеза принимается ) и

. ( множество точек, для которых гипотеза отвергается ). Множество

называют областью принятия гипотезы , а

- областью ее отклонения или критической областью . Вероятность попадания выборки в критическую область при заданной функции распеределения, называют функцией мощности критерия . Если альтернативной к испытуемой является простая гипотеза, то она однозначно определяет распеределение. Значение функции мощности для этого распределения называют мощностью критерия .

Вернемся к рассмотрению примера с оценкой вероятности правильной классификации. Ошибка первого рода состоит в том, что, когда вероятность правильной классификации действительно равна

, число правильных классифкаций

. Значение ошибки первого рода может быть вычислено следующим образом:

Ошибка второго рода состоит в том, что при вероятности правильной классификации

, число правильных классификаций

. Эта вероятность вычисляется по формуле:

Если задан уровень значимости

, то пороговое значение

, задающее критическую область, определяется из неравенства:

Функция мощности критерия - это вероятность попадания в критическую область:

Пусть теперь альтернативной гипотезой для

будет простая гипотеза

., тогда мощность критерия, равная вероятности попадания в критическую область, когда верна альтернативная гипотеза, вычисляется бы по формуле.

Вероятность ошибки второго рода равна в этом случае равна

5. Охарактеризуйте термин процентили

Процентиль (этот термин был впервые использован Галтоном в 1885 г.) распределения - это такое число x_p, что значения p-й части совокупности меньше или равны x_p. Например, 25-я процентиль (также называемая квантилью 0.25 или нижней квартилью) переменной - это такое значение (x_p), что 25% (p) значений переменной попадают ниже этого значения.

Аналогичным образом вычисляется 75-я процентиль (также называемая квантилью 0.75 или верхней квартилью) - такое значение, ниже которого попадают 75% значений переменной. Способ расчета процентилей можно задать на вкладке Общие настройки в диалоговом окне Параметры по умолчанию (это окно вызывается нажатием кнопки Опции в меню Сервис).

6. Если коэффициент корреляции положителен, то между исследуемыми величинами есть прямая зависимость

7. Когда необходимо использовать понятие «зона значимости»?

Понятие «зона значимости « используется при оценке испытаний при использовании различных критериев (например. G-критерий), когда получаемое число попадает в зону. Когда принимается альтернативная гипотеза.

8. Решить задачу, используя парный критерий тенденций Т-Вилкоксона

У 19 испытуемых определили количество ошибок при выполнении корректурной пробы до и после коррекционных упражнений. Психолог определяет будет ли уменьшаться количество ошибок внимания у респондентов после специальных коррекционных упражнений.

До	24	12	42	30	40	55	50	52	50	22
после	22	12	41	31	32	44	50	32	32	21

До	33	78	79	25	28	16	17	12	25
После	34	56	78	23	22	12	16	18	25

Решение

1. проверим выполнимость ограничений: 5 ≤ 19 ≤ 50;

2. запишем данные в таблицу и сделаем необходимые вычисления:

№ испыт.	Замер 1	Замер 2	di = «после» - «до»	\|di\|	Ранг \|di\|	Ранг «нетип.»
1	24	22	-2	2	7,5	7,5
2	12	12	0	0
3	42	41	-1	1	3,5	3,5
4	30	31	1	1	3.5
5	40	32	-8	8	12	12
6	55	44	-11	11	13	13
7	50	50	0	0
8	52	32	-20	20	15	15
9	50	32	-18	18	14	14
10	22	21	-1	1	3,5	3,5
11	33	34	1	1	3,5
12	78	56	-22	22	16	16
13	79	78	-1	1	3,5	3,5
14	25	23	-2	2	7.5	7.5
15	28	22	-6	6	3,5	3,5
16	16	12	-4	4	3,5	3,5
17	17	16	-1	1	3,5	3,5
18	12	18	6	6	3,5
19	25	25	0	0
Суммы	-	-	-	-	151	106

Исключим нулевые сдвиги и подсчитаем новый объем выборки: n.= 19-3 = 16;