Смекни!
smekni.com

Интервальная группировка (стр. 5 из 5)

Кнопка Откр/Сохр используется для открытия файла системы STATISTICA со стандартными Условиями выбора наблюдений (которые могут использоваться в программе для выбора или фильтрации наблюдений для всех видов анализа), а также для сохранения текущего условия для каждой Категории. При нажатии кнопки Откр/Сохр открывается диалоговое окно Условия выбора наблюдений, в котором можно отредактировать, сохранить или открыть условия выбора наблюдений (это те же самые условия, которые используются для обработки подгрупп наблюдений во всей программе). Условия выбора наблюдений из этого диалогового окна сохраняются в файле с расширением *.sel. При нажатии кнопки OK в диалоговом окне Условия выбора наблюдений, введенные условия будут использованы для разбиения на подгруппы.

Кнопка Просмотр переменных открывает диалоговое окно Выбрать переменную, в котором можно посмотреть переменные текущего файла данных.

Кнопка Открыть ... открывает диалоговое окно Открыть условия, в котором можно выбрать файл (содержащий все условия выбора подгрупп), который нужно открыть в диалоговом окне Определить категории. В этом диалоговом окне открываются стандартные текстовые файлы с расширением *.txt.

Кнопка Сохранить ... открывает диалоговое окно Сохранить условия, где можно указать имя файла, в котором будут сохранены все условия выбора. Это файл будет сохранен в текстовом виде с расширением *.txt.

Вкладка Опции

Установки опций этой вкладки определяют способы отображения результатов и то, как будут удаляться пропущенные данные рис.3.4.

Группа Опции отображения в таблицах частот определяет статистики, которые вычисляются для каждой категории в Таблицах частот. В зависимости от выбора в поле Удаление ПД STATISTICA включает ПД в обработку, или исключает их из нее.

Кумулятивные частоты – Опция вычисляет кумулятивные или накопленные частоты. Это сумма частот по последовательным интервалам группировки.

Проценты (относительные частоты)) – вычисляются относительные частоты.

Кумулятивные проценты - вычисляются кумулятивные или накопленные проценты.

100% минус кумулятивные проценты – вычисляются 100 минус кумулятивные проценты.

Логит преобразования частот – для частот каждого интервала производится преобразование логит. В частности, логиты для категории i вычисляются из соответствующей кумулятивной пропорции pi как:

.

Пробит преобразования частот – для кумулятивных частот каждого интервала производится преобразование пробит – вычисляются z-значения, связанные с вероятностью в соответствующей ячейке.

Ожидаемые нормальные частот – вычисляется нормальное приближение для наблюдаемых частот.

В нижней части окна указаны опции, назначение которых опций следующее:

Считать пропущенные данные (ПД) – Опция вычисляет группу специально для пропущенных данных. Проценты и кумулятивные (накопленные) проценты также вычисляются для пропущенных данных.

Считать ПД и невыбранные переменные – опция вычисляет дополнительно группы невыбранных (и не пропущенных) наблюдений в таблице частот. Вычисляются проценты и кумулятивные проценты относительно общего числа наблюдений.

Вкладка Описательные

Опции этой вкладки рис.3.5 служат для просмотра набора статистик и графиков распределений для каждой из выбранных переменных.

Описательные статистики. Опция строит таблицы с описательными статистиками для выбранных переменных аналогично одноименной опции во вкладке Быстрые.

Имеется несколько кнопок для графического представления результатов наблюдений:

Диаграмма размаха для всех переменных. Процедура строит каскад диаграмм размаха для зависимых переменных; один график для каждой переменной. Каждая группа представлена одним графиком, который состоит из трех компонент:

1. Центральная точка, показывающая главную тенденцию или положение;

2. Прямоугольник, показывающий разброс значений относительно главной тенденции;

3. Отрезки вокруг прямоугольника, показывающие диапазон значений переменной.

При нажатии этой кнопки появляется диалоговое окно Диаграмма размаха рис.3.6 , в котором необходимо выбрать тип диаграммы для построения.

Нормальные вероятностные графики. Процедура строит последовательность нормальных вероятностных графиков - один график для каждой выбранной переменной.

Полунормальные вероятностные графики. Процедура строит последовательность полунормальных вероятностных графиков - один график для каждой выбранной переменной.

Нормальные вероятностные графики без тренда. Процедура строит последовательность нормальных вероятностных графиков без тренда - один график для каждой выбранной переменной.

Правила построения вероятностных графиков описаны в гл. 2.

3М гистограммы. Эта опция строит каскад 3М гистограмм для выбранных переменных, по одному на каждую выбранную переменную. После нажатия этой кнопки программа попросит пользователя выбрать два набора переменных (из выбранных ранее с помощью кнопки Переменные). 3М гистограммы будут построены для каждой пары переменных, включающей переменные из разных списков.

Вкладка Нормальность

Вкладку Нормальность обеспечивает доступ к представленным опциям рис.3.7. Эти опции служат для проверки нормальности выбранных переменных. Если выбрана любая из представленных здесь опций, то при построении таблицы частот (посредством кнопки ОК) для выбранной переменной, будет построена еще одна таблица, содержащая результаты выбранных критериев нормальности (одна таблица на критерий).

Критерии нормальности. Кнопка выведет таблицы результатов с запрошенными критериями нормальности для выбранных переменных.

Критерий Колмогорова-Смирнова, ср./ст.откл. известны. Опция вычисляет одновыборочный критерий Кoлмогорова-Смирнова. Если D статистика значима, то гипотеза нормальности распределения значений переменной отвергается. Вычисляются два значения вероятности для каждого критерия: первое, табулировано Massey (1951), относится к случаю, когда параметры распределения - среднее и стандартное отклонение известны заранее и не оцениваются. Однако обычно эти параметры не известны и оцениваются по наблюдениям. Тогда проверяется сложная гипотеза (с неизвестными заранее параметрами распределения и вычисляются вероятности Лиллиефорса.

Критерий Лиллиефорса, ср./ст.откл. неизвестны. Если эта опция выбрана, то программа вычислит одновыборочную D статистику Колмогорова-Смирнова, а также вероятности Лиллиефорса (см. предыдущий абзац).

Критерий Шапиро-Уилка W. Опция вычисляет W статистику Шапиро-Уилка для каждой выбранной переменной. Если W-статистика значима, то гипотеза нормальности отвергается. Заметим, что в STATISTICA используется улучшенная версия алгоритма, которая применима к выборкам, содержащим до 2000 наблюдений; если число наблюдений больше 2000, этот критерий неприменим.

Пример: Технологию расчета описательных характеристик вариационного ряда в программе Statistica покажем на примере данных, представленных в табл.2.1.

Расположение исходных данных в таблице данных представлено на рис.2.9.

Для выполнения группировки в системе Statistica из стартовой панели Описательные статистики и таблицы выбирается процедура Таблица частот. По этой команде открывается одноименный диалог рис.3.1, в котором произведем следующие установки:

· Переменные - выбираем список переменных для анализа, в данном случае переменную Var1.

· Активизируем вставку Дополнительно и в группе опций Mетод категоризации для таблиц и графиков устанавливаем флажок перед опцией Число равных интервалов равным 9 интервалов

· Активизируем вставку Опции и в группе опций Опции отображения устанавливаем флажки перед опциями:

- Кумулятивные частоты – вычисляем кумулятивные или накопленные частоты.

- Проценты (относительные частоты) – вычисляем относительные частоты.

- Кумулятивные проценты - вычисляем кумулятивные или накопленные проценты.

- 100% минус кумулятивные проценты – вычисляем 100 минус кумулятивные проценты.

- Логит преобразования частот – для частот каждого интервала производим преобразование логит:

- Ожидаемые нормальные частоты – вычисляем нормальное приближение для наблюдаемых частот.

· Активизируем вставку Нормальность и выделяем флажками следующие опции:

- Критерий Колмогорова-Смирнова, ср./ст. откл. известны – вычисляем одновыборочный критерий Колмогорова-Смирнова

- Критерий Лиллиефорса, ср./ст. откл. неизвестны –вычисляем вероятности Лиллиефорса, на основе которых вычисляем одновыборочную D статистику Колмогорова-Смирнова.

- W критерий Шапиро-Уилка – вычисляем W статистику Шапиро-Уилка.

При нажатии на кнопку Таблицы частот получаем результирующую таблицу частот, представленную на рис.3.8,а).

При нажатии на кнопку Гистограммы получаем гистограмму распределения частот рис.3.8,б).

При нажатии на Критерий нормальности вкладки Нормальность – на экран выводятся таблицы результатов со значениями критериев нормальности рис.3.9.

На рис.2.14 представлена распечатка таблицы частот.

STAT. VAR1 (new.sta)

Cumul. Cumul. 100% -

Category Count Count Percent Percent Percent

,457143<x<=1,94285 4 4 4,00 4,00 100,00

1,94286<x<=3,42857 12 16 12,00 16,00 96,00

3,42857<x<=4,91428 35 51 35,00 51,00 84,00

4,91429<x<=6,40000 22 73 22,00 73,00 49,00

6,40000<x<=7,88571 11 84 11,00 84,00 27,00

7,88571<x<=9,37142 13 97 13,00 97,00 16,00

9,37143<x<=10,8571 2 99 2,00 99,00 3,00

10,8571<x<=12,3428 1 100 1,00 100,00 1,00

Missing 0 100 0,00 100,00 0,00

STAT. VAR1 (new.sta)

Category Logits

,457143<x<=1,94285 -3,17

1,94286<x<=3,42857 -1,65

3,42857<x<=4,91428 ,04

4,91429<x<=6,40000 ,99

6,40000<x<=7,88571 1,65

7,88571<x<=9,37142 3,47

9,37143<x<=10,8571 4,59

10,8571<x<=12,3428 --

Missing

Рис.2.14. Распечатка таблицы частот