Смекни!
smekni.com

Анализ данных в линейной регрессионной модели (стр. 1 из 3)

Государственное образовательное учреждение высшего профессионального образования

«Московский государственный институт электронной технки

(технический универститет)»

Курсовая работа

по дисциплине

«Теория вероятности и математическая статистика»

Тема работы

«Анализ данных в линейной регрессионной модели»

Выполнил:

Студент группы ЭКТ-21

Рыжов С.А.

Проверил:

Преподаватель

Бардушкина И. В.

Москва - 2010


Вариант 20.

Задание 1

Выполнить предварительную обработку результатов наблюдений, включающую:

1 построение диаграммы рассеивания (корреляционного поля);

2 группировку данных и построение корреляционной таблицы;

3 оценку числовых характеристик для негруппированных и группированных данных.

Оценка числовых характеристик для негруппированных данных:

X Y X Y
4,19 9,19 4,44 9,13
3,04 11,94 11,31 4,58
4,6 8,09 7,57 3,14
9,83 10,33 1,62 14,61
8,66 7,15 5,71 6,48
1,3 12,34 11,06 6,78
4,22 16,35 10,35 2,15
5,11 7,7 2,46 9,66
9,85 5,64 1,02 11,19
8,8 4,52 5,77 7,77
12,17 4,52 8,63 4,05
11,25 2,06 6,91 4,76
5,73 7,41 3,56 8,54
4,05 10,51 9,47 2,22
5,41 9,97 6,16 3,72
1,28 14,68 8,26 3,57
1,67 9,67 6,7 14,32
11,99 3,31 4,95 10,64
7,66 5,93 3,37 10,73
5,17 9,87 1,53 10,13
3,26 11,52 9,54 4,95
12,58 2,88 3,11 5,38
8,34 3,57 5,09 5,79
5,79 4,39 11,08 3,87
3,42 9,71 8,74 -2,23
Сумма X 317.78
Сумма Y 369,18
MX 6,3556
MY 7,3836
s2X 11,02005
s2Y 15,31479
KXY -9,1594
ρXY -0,7194

Числовые характеристики для негруппированной выборки находятся по следующим формулам:

,
;

;

;

;

;

Построение корреляционного поля:

Построение корреляционной таблицы:

Таблица 1.1

Y X -1.5 1.5 4.5 7.5 10.5 13.5 16.5 ni.
2.5 0 0 1 1 8 3 0 13
5.5 0 0 4 5 6 1 1 17
8.5 1 1 8 1 1 0 0 12
11.5 0 3 4 1 0 0 0 8
nj. 1 4 17 8 15 4 1 50

Оценка числовых характеристик для группированных данных:

,
;

,
;

;

;

,
;

;

;

= - 0.87

Задание 2

Для негруппированных данных проверить гипотезу

об отсуствии линейной статистической связи между компонентами X и Y при альтернативной гипотезе
( уровень значимости α = 0,05);

Выборочное значение статистики равно

,

Используя средства Matlab, найдем


Так как выборочное значение статистики больше квантили распределения Стьюдента, гипотеза H0 отклоняется в сторону гипотезы H1. Корреляция значима.

Задание 3

Для негруппированых данных получить интервальную оценку для истинного значения коэффициента корреляции ρX,Y, при уровне значимости α = 0,05.

Используя средства Matlab, найдем

,

,

Задание 4

Для негруппированных и группированных данных составить уравнения регрессии Y на x и X на Y.

Рассмотрим вначале случай негруппированных данных.

Этот интервал не содержит нуля, т.е. с доверительной вероятностью 1 – ЫВА = 0,95 существует корреляция между X и Y и имеет смысл построение уравнений регрессии.


,

y(x) = 12,77 – 0,848*x;

x(y) = 10,86 – 0,6*y;

Проверка.

,
.

,
;

,

,
;

Случай группированных данных.

Подставим найденные значения

в уравнеиня линейной регрессии Y на x и X на y. Получим:

y(x) = 17,14 – 1,4*x;

x(y) = 10,83 – 0,54*y;

Проверка:

Задание 5

Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.


Задание 6

Для негруппированных данных по найденным оценкам параметров линейной регрессии Y на x получить оценку s2 для дисперсии ошибок наблюдений σ2, найти коэффициент детерминации R2, построить доверительные интервалы для параметров регрессии a и b, дисперсии ошибок наблюдений σ2 и среднего значения Y при x = x0 .

Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии:

,
,
,
,
,
,
,
.