Смекни!
smekni.com

Регресійний аналіз інтервальних даних (стр. 2 из 6)

Нехай прогнозоване значення

визначається по рівнянню регресії з оціненими параметрами

(2.1)

В силу того, що

- незміщені оцінки деяких невідомих параметрів відповідного взаємозв'язку,
- одне з можливих значень прогнозованої величини при заданих значеннях
, точніше - це оцінка середнього значення
. Оскільки
випадкова величина, то і оцінка
також випадкова і має дисперсію. Визначимо її значення.

Використавши теорему про дисперсії суми залежних величин, одержимо:

Перепишемо у вигляді:

де

- вектор заданих значень незалежних змінних. Звідки одержимо:

Оскільки значення

нам відомо, то введемо в останню формулу її оцінку
, звідки дисперсія
буде:

(2.2)

Таким чином, середнє значення

лежить у межах:

(2.3)

Розділ ІІІ. Лінійний регресійний аналіз інтервальних даних

Перейдемо до багатомірного статистичного аналізу. Спочатку з позиції асимптотичної математичної статистики інтервальних даних розглянемо оцінки методу найменших квадратів (МНК).

Статистичне дослідження залежностей - одне з найбільш важливих задач, які виникають у різних галузях науки й техніки. Під словами "дослідження залежностей" мається на увазі виявлення і опис існуючого зв'язку між досліджуваними змінами на підставі результатів статистичних спостережень.

Якщо яка-небудь група об'єктів характеризується змінними

і проведений експеримент, що складається з n досвідів, де в кожному досвіді ці змінні вимірюються один раз,то експериментатор одержує набір чисел:
.

Але процес виміру не дає однозначний результат. Реально результатом виміру якої-небудь величини Х є два числа:

- нижня границя і
- верхня границя. Причому
, де
- істинне значення вимірюваної величини. Результат виміру можна записати як
. Інтервальне число X може бути представлене іншим способом, а саме,
, де
. Тут
- центр інтервалу (як правило не співпадає з
), а Δx - максимально можлива похибка виміру.

3.1 Метод найменших квадратів для інтервальних даних

Нехай математична модель задана:

(3.1.1)


де х = (х1, х2,..., хm) - вектор впливаючих змінних, що піддаються виміру;

- вектор оцінюваних параметрів моделі; у - відгук моделі (скаляр); Q(x,
)-
скалярна функція векторів х і
; і ε - випадкова похибка.

Нехай проведено n досвідів, причому в кожному досвіді обмірювані (один раз) значення відгуку (у) і вектора факторів (х). Результати вимірів можуть бути представлені в наступному виді:

де Х - матриця значень обмірюваного вектора (х) в n досвідах; Y - вектор значень обмірюваного відгуку в n досвідах; Е - вектор випадкових помилок. Тоді виконується матричне співвідношення:

, (3.1.2)

де

, причому
- n-мірні вектора, які становлять матрицю

Введемо міру близькості

між векторами
і
. В МНК в якості
береться квадратична форма зважених квадратів
нев'язань

,

тобто


де

- матриця ваг, що не залежить від
. Тоді як оцінка
можна вибрати таке
, при якому міра близькості d(Y,Q) приймає мінімальне значення, тобто

.

У загальному випадку рішення цього екстремального завдання може бути не єдиним. Тому надалі будемо мати на увазі одне із цих рішень. Воно може бути виражене у вигляді:

причому

неперервні і дифференційовні по (Х,Y)
Z, де Z - область визначення функції f(X,Y). Ці властивості функції f(X,Y) дають можливість використати підходи статистики інтервальних даних.

Перевага методу найменших квадратів полягає в порівняльній простоті й універсальності обчислювальних процедур. Однак не завжди оцінка МНК є самостійною, що обмежує його застосування на практиці.

Важливим частковим випадком є лінійний МНК, коли Q(x,

) є лінійна функція від

:

,

де

= 1, а

- вільний член лінійної комбінації. Як відомо, у цьому випадку МНК-оцінка має вигляд:

Якщо матриця

невироджена, то ця оцінка є єдиною. Якщо матриця ваг W одинична, то

Нехай виконуються наступні припущення щодо розподілу похибок

:

- помилки

мають нульові математичні очікування М{
} = 0,

- результати спостережень мають однакову дисперсію D {

} =
,

- помилки спостережень некорельовані, тобто

.