Смекни!
smekni.com

Интервальная группировка (стр. 4 из 5)

Отмена. При нажатии кнопки Отмена закрывается текущий диалог и появляется стартовая панель модуля Основные статистики и таблицы.

Опции. При нажатии этой кнопки вызывается меню Опции в котором устанавливаются режим вычисления с повышенной точностью и некоторые параметры отображения таблиц и графиков.

Ниже кнопки Опции находятся две кнопки: Кнопка SELEKT CASES (Выбор наблюдений). При нажатии этой кнопки появляется диалоговое окно Условия выбора наблюдений Анализа/Графика. Эта функция используется для того, чтобы включить в анализ только подмножество наблюдений.

При нажатии кнопки В (Вес) появляется диалоговое окно Веса наблюдений Анализа/Графика. Эта функция позволяет "изменять" вклад отдельных наблюдений, пропорциональных значениям выбранной переменной.

Правила установки Условий выбора наблюдений и установка весов наблюдений описаны в гл.1.

В правом нижнем углу диалогового окна находится группа опций Удаление ПД. Если выбрано Построчное удаление пропусков, то STATISTICA игнорирует все наблюдения, имеющие пропуски хотя бы для одной переменной в списке. Если выбрано Попарное удаление пропусков, то наблюдения будут удаляться из вычислений вместе с переменными, для которых в них содержатся пропущенные данные.

Вкладка Быстрый

Вкладка Быстрый содержит доступ к опциям, представленным на рис.3.1.

Кнопка Таблицы частот строит последовательность таблиц частот для выбранных переменных по одной для каждой переменной. Способ, которым переменные группируются в таблицах частот определяется опцией из набора опций Mетод категоризации для таблиц и графиков (см. вкладку Дополнительно). Опции из раздела Опции отображения (см. вкладку Опции) определяют различные обобщающие статистики, которые будут включены в таблицу частот. Если выбран какой-либо Критерий нормальности (например, если выбрана любая опция из раздела, см. вкладку Нормальность), тогда для каждой переменной появится дополнительная таблица с результатами вычисления соответствующего критерия.

Кнопка Гистограммы строит последовательность гистограмм по одной для каждой выбранной переменной. Способ группировки переменных при построении гистограмм определяется теми же настройками, что и при построении Таблиц частот.

Кнопка Описательные статистики строит таблицы с описательными статистиками для каждой переменной. Способ обработки данных при вычислении описательных статистик зависит от установки опции в наборе Mетод категоризации для таблиц и графиков (см. вкладку Дополнительно):

В частности:

1. Если выбрана опция Размер шага и пользователем задано минимальное значение, тогда все наблюдения, которые не превышают это заданное значение, будут проигнорированы;

2. Если выбрана опция Целые категории, то все нецелые значения будут проигнорированы;

3. Если выбрана опция Заданные группирующие коды (значения), то все значения, которые не совпадают ни с одним из выбранных целых кодов, будут проигнорированы;

4. Если выбрана опция Определенные пользователем категории, то кнопки Описательные статистики будут неактивными (потому что сложные правила разбиения на группы могут привести к тому, что одно наблюдение может быть приписано более чем к одной категории). Наблюдение будет приписано первому Определенному пользователем интервалу, которому оно "удовлетворяет" и Описательные статистики для этих интервалов вычисляться не будут.

Во всех случаях пропущенные данные будут построчно или попарно, удаляться в зависимости от выбора в разделе Удаление ПД.

3М гистограммы. Эта опция строит последовательность 3М гистограмм для выбранных переменных, по одному на каждую выбранную переменную. После нажатия этой кнопки программа попросит пользователя выбрать два набора переменных (из выбранных ранее с помощью кнопки Переменные). 3М гистограммы будут построены для каждой пары переменных, включающей переменные из разных списков.

Вкладка Дополнительно

Вкладка Дополнительно содержит доступ опциям, представленным на рис.2.3. Данные опции служат для управления способом группировки в таблицах частот, в графиках и при расчете описательных статистик.

Кнопки Таблицы частот и Гистограммы имеют такое же назначение, что и во вкладке Быстрый.

Опции в наборе Mетод категоризации для таблиц и графиков определяют, как будут сгруппированы или табулированы выбранные переменные в таблицах частот и в гистограммах, а также как обрабатываются наблюдения при расчете описательных статистик.

Все различные значения – частоты строятся с учетом всех различных значений анализируемых переменных.

С текстовыми значениями – частоты строятся с учетом всех текстовых значений выбранных переменных.

Число равных интервалов – диапазон значений каждой переменной делится на указанное число интервалов:

Приблизительное число интервалов: – построит приближенные интервалы и выберет приближенный шаг так, что последняя десятичная цифра в значениях границ интервалов будет равна 1, 2 или 5 (например, 10.5, 11.0, 11.5, и т.д.). Такие интервалы легче интерпретировать, чем интервалы с большим числом десятичных разрядов.

Размер шага – Опция задает ширину интервала категоризации в таблицах частот (и гистограммах). Если выбрана опция с мин. значения, то группировка начинается с минимального значения переменной (первый интервал группировки включает это значение). Если опция не выбрана, то левая граница первого интервала группировки задается пользователем в соответствующем поле.

Целые значения – Если опция выбрана, то границами интервалов категоризации в таблицах частот (и гистограммах) будут целые числа, а размер шага равен наименьшему целому значению. Все нецелые значения переменных будут проигнорированы программой в процедурах Таблицы частот - Гистограммы и Описательные статистики. Если выбрана опция с текст. значениями, тогда категории при выборе таблиц частот и гистограмм будут помечены текстовыми значениями (например, мужчины, женщины) а не целыми значениями (например, 1, 2), которые доступны в текущем файле данных границами интервалов группировки будут целые значения, а размер шага будет равен наименьшему целому значению. Все нецелые значения переменных будут игнорированы программой.

Заданные группирующие коды (значения) – таблицы частот и гистограммы будут построены с помощью целых кодов, определенных пользователем и задаваемых с помощью отдельной группирующей переменной (см рис.2.5). Все нецелые значения переменных будут проигнорированы программой

Определенные пользователем категории – позволяет определить до 16 логических условий, позволяющих отнести наблюдения к определенной категории в таблице частот.

При нажатии кнопки Определенные пользователем категории вызовается диалоговое окно Определить категории рис.3.3. Диалоговое окно позволяет вам задать до 16 условий выбора наблюдений для использования их в вычислениях таблиц частот (разбиения наблюдений на категории). Заданные здесь условия выбора будут проверены последовательно; т.е. наблюдение попадет в первую категорию, к которой он "подходит".

Заметим, что в файле данных вы так же можете создать новую (группирующую) переменную и задать в ней необходимые значения. Например, это бывает удобным, когда вам требуется перекодировать данные так, что значения целевой переменной не фиксированы, а рассчитываются по специальному закону (например как среднее набора других значений). Для этого воспользуйтесь формулами в таблице исходных данных, или для более сложных вычислений, средой разработки STATISTICA Visual Basic.

Пример. Этот набор (двух) условий выбора приведет к образованию двух групп в таблице частот. Первая группа будет содержать все наблюдения со значениями переменной 1, которые больше нуля или равны нулю, вторая группа будет содержать все наблюдения со значениями переменной 1, которые меньше нуля.

Категория 1: Включ., если: v1>=0

Категория 2: Включ., если: v1<0

Задание категорий в полях Категория 1, 2, 3, …. Прокручивая этот список, можно определить до 252 категорий, разбивающих наблюдения на подгруппы. Заданные здесь условия выбора будут проверены последовательно; т.е. наблюдение попадет в первую категорию, к которой он "подходит"

· Включить/Исключить, если: Если выбрана команда Включ., если то значения выделенной переменной для наблюдений, которые удовлетворяют условию, будут помещены в соответствующую группу. Если выбрана команда Искл., если то значения выделенной переменной для наблюдений, которые удовлетворяет заданному условию, будут исключены из группы.

· Условия выбора наблюдений задаются в полях ввода Категория 1, 2, 3, … согласно стандартным Условиям выбора наблюдений системы STATISTICA.

· Операторы. При задании условия используются операторы: =, <>, <, >, <=, >=, NOT, AND, OR

· Имена переменных. В условиях необходимо указать имена переменных (например, v1, v2, v3, . . . ) или их имена (например, Пол, Дата, Время, . . .).

· Номер наблюдения. Обозначение v0 задает номера наблюдений

Примеры: v1=0 OR v2>=0;

(v1<1 OR v9='YES' ) AND v4<>0

Замечание: При использовании текстовых значений нужно заключать их в апострофы, например, 'Yes'.