Смекни!
smekni.com

Розрахунок типових задач з математичної статистики (стр. 2 из 4)

Пояснюється це тим, що при меншій кількості значень випадкової величини X, що попадають в межі будь-якого інтервалу розбиття, випадкові відхилення (флуктуації) її значень від істинного зміщують практично отримане значення до сусідніх інтервалів. Загальна картина погіршується, похибка розрахунків збільшується.

Позначимо кількість інтервалів розбиття s.

Окрім цього потрібно врахувати також число ступенів свободи (чого, буде вказано далі) - позначимо його k (воно знадобиться при підрахунку критерію збіжності Пірсона, бо має для нього дуже важливе значення; а поки воно впливатиме лише на розбиття діапазону значень випадкової величини X). В нашому випадку оцінимо його значення числом інтервалів (в дійсності число ступенів свободи менше: k<s), тобто вважатимемо k≈s. Пояснимо такий вибір тим, що, взагалі, число ступенів свободи при першому наближенні - число незалежних значень, які може приймати випадкова величина (які їй ніщо не заважає набувати). В нашому випадку (при розбитті діапазону зміни значень випадкової величини X на s інтервалів) кількість значень випадкової величини, що попадають в кожний інтервал, буде також випадковою величиною. Як би ми не проводили розбиття всього діапазону на s інтервалів, завжди б отримали s таких кількостей.

Якщо k приблизно дорівнює декільком десяткам (тобто приблизно k>30), то число значень, що попадають в кожний інтервал розбиття, можна зменшити до 5, або навіть до 3. За великих об’ємів вибірки довжину всіх інтервалів беруть однаковою.

Необхідне для застосування методу Пірсона розбиття можна звести до розбиття на рівновіддалені.

1) Для більшої зручності в представленні результатів розбиття та подальших обчислень, мабуть, було б бажано межі діапазону розбиття округлити до більшого цілого для додатних чисел та меншого цілого для від’ємних чисел (зробити межі діапазону цілими).

2) Розбити діапазон значень випадкової величини X на інтервали однакової довжини, при цьому по можливості задаючи межі кожного інтервалу цілими або напівцілими значеннями. Кількість інтервалів s0 на цьому етапі не дорівнює s, а більша (бо серед цих інтервалів є такі, що не задовольняють застосувати метод Пірсона для отримання „хороших” результатів).

Результати занести в таблицю.

Коректування розбиття буде проводитися в наступному пункті.

Обчислити частоти появи значень випадкової величини X в кожному з інтервалів розбиття - експериментальні частоти (вони будуть розглядатися як експериментальні, або практичні, імовірності появи значень цієї випадкової величини - оцінками імовірності).

,
,

де ni - кількість експериментальних даних, що попали в і-й інтервал, N - загальна кількість експериментальних даних (у РГЗ N = 100).

Отримані результати занести в таблицю (див. далі Таблицю 3.1).

Розбиття на рівновіддалені дає наглядну картину розподілення значень випадкових величин. Але для застосування методу Пірсона таке розбиття не годиться, бо дасть не дуже „хороші" результати.

Тому необхідно провести корекцію розбиття:

Розширити інтервали, що не задовольняють критерію розбиття (кількість значень випадкової величини X, що попадають у кожний інтервал, повинна бути не менша 10). Розширення здійснюється укрупненням інтервалів шляхом складання частот появи значень випадкової величини X в інтервалі, що не задовольняє умовам розбиття, з частотами появи значень випадкової величини X в сусідніх інтервалах.

Оновлені дані занести в нову таблицю для застосування методу Пірсона (див. далі Таблицю 3.2).

Таким чином, застосування методу Пірсона повинне буде дати „хороші" результати.

Провести обчислення оцінок основних характеристик випадкової величини (бо, по-перше, виявивши деякий зв’язок між ними, можна буде зробити припущення про можливий закон розподілення, по-друге, вони використовуються при розрахункові теоретичних ймовірностей).

Розрахунок оцінки математичного чекання (знаходження вибіркової середньої) можна провести за наступною оціночною формулою:

,

де Xi - отримане в вибірці і-те значення випадкової величини (

), N - загальна кількість експериментальних даних (у РГЗ N = 100).

Розрахунок оцінки дисперсії (розрахунок вибіркової дисперсії) можна провести за наступною оціночною формулою:

,

де Xi - отримане в вибірці і-те значення випадкової величини (

),
- оцінка математичного очікування випадкової величини X, що розглядається.

Або ж застосувати загальний теоретичний зв‘язок між дисперсією та математичним чеканням (що буде дещо неправильним для знаходження вибіркової дисперсії):

.

Середньоквадратичне відхилення також розраховується через загальний теоретичний зв‘язок між ним та дисперсією:

(вибіркове середньоквадратичне відхилення).

Побудувати гістограму або багатокутник розподілення - експериментальний (практичний) варіант графіка функції щільності імовірності.

Гістограма та багатокутник розподілення будуються за даними Таблиці 3.1

Гістограма матиме вигляд стовбчастої діаграми (основа кожного прямокутника - і-й інтервал розбиття, висота - частота появи значень випадкової величини X в і-му інтервалі). Багатокутник розподілення - незамкнута ламана (і-та вершина ламаної знаходяться над серединою і-го інтервалу розбиття на висоті, що відповідає частоті появи значень випадкової величини X в і-му інтервалі).

Проаналізувати обчислені оцінки математичного чекання та отриману гістограму. На основі цього зробити припущення про можливий закон розподілення випадкової величини - висунути гіпотезу H0. Далі відповідно до неї обчислити теоретичні значення ймовірностей попадання випадкової величини X в кожний з s інтервалів розбиття.

Якщо випадкова величина X приймає від’ємні значення, то вона не може бути розподіленою за біноміальним, пуасоновським, експоненціальним законами.

Якщо побудована гістограма починається з максимуму імовірності та далі спадає, також

, то випадкова величина X може бути розподіленою за експоненціальним законом.

Якщо

, то випадкова величина X може бути розподіленою за законом Пуассона.

Якщо виконується зв’язок

та
, то випадкова величина X може бути розподіленою за біноміальним законом (Бернуллі).

Для законів розподілення Бернуллі та Пуассона (його окремий випадок) форма гістограми сильно залежить від основних параметрів випадкової величини (максимум імовірності може переміщатися від початку в деякому інтервалі), але максимум завжди вирізняється досить чітко.

Якщо максимум імовірності на побудованій гістограмі нечіткий та виконується „правило 3-х сігм” (більшість значень випадкової величини лежить у інтервалі

,

а імовірність появи значень, що лежать за межами цього інтервалу приблизно не перевищує 0.0027), то можна припустити, що випадкова величина X розподілена нормально (за Гауса законом розподілення). В цьому випадку відхилення практичної гістограми нормально розподіленої випадкової величини від теоретичної допоможе оцінити асиметрія та ексцес.

Таблиця 3.1

І 1 2 3 4 ... s0
і-й рівновіддалений інтервал діапазону значень випадкової величини за даними вибірки, (Xi - 1; Xi) (X0; X1) (X1; X2) (X2; X3) (X3; X4) (XS0 - 1; XS0)
Кількість значень випадкової величини X, що попадають в даний інтервал, ni n1 n2 n3 n4 nS0
Частоти появи значень випадкової величини X, що лежать в і-му рівновіддаленому інтервалі,
...

Таблиця 3.2

І 1 2 3 4 ... s
і-й інтервал діапазону значень випадкової величини за даними вибірки, (Xi - 1; Xi) (X0; X1) (X1; X2) (X2; X3) (X3; X4) (XS - 1; XS)
Кількість значень випадкової величини X, що попадають в даний інтервал, ni n1 n2 n3 n4 nS
Частоти появи значень випадкової величини X, що лежать в і-му інтервалі,
...
Теоретичні імовірності знаходження значень випадкової величини X в і-му інтервалі,
...
Теоретична кількість значень випадкової величини X, що попадають в даний інтервал, ni0 n10 n20 n30 n40 ... nS0

Обчислення теоретичних ймовірностей знаходження значень випадкової величини X в і-му інтервалі проводиться шляхом взяття визначеного інтеграла від функції щільності імовірності. Вигляд функцій щільності імовірності для основних законів розподілення випадкових величин відомий. Параметрами цих функцій при обчисленнях будуть попередньо підраховані оцінки основних параметрів випадкової величини - вибіркова середня, вибіркова дисперсія, вибіркове середньоквадратичне відхилення.