регистрация /  вход

Статистический пакет STATISTIKA (стр. 1 из 4)

Содержание

Введение

1. Теоретические сведения

1.1 Статистика. Виды статистического анализа

1.2 Статистический пакет STATISTICA

2. Статистический анализ экономических данных в STATISTICA

2.1 Практическое задание. Корреляционно-регрессионный анализ в STATISTICA

2.2 Практическое задание

2. Кластерный анализ в STATISTICA


Введение

Для обеспечения эффективности производства необходимо четко знать:

- Как анализировать и прогнозировать процессы?

- Как повысить эффективность производства и сократить затраты?

- Как обеспечить стабильность показателей качества продукции?

- Как принять оптимальное решение на основе анализа данных?

- Как организовать управление корпоративными источниками информации?

Для решения этих и многих других задач в области социологических и маркетинговых исследований, прогнозирования и управления качеством необходимы знания математической и экономической статистики. Принятие любого технического, финансового и производственного решения немыслимо без статистического анализа информации; выделять закономерности из случайностей, сравнивать вероятные альтернативы выбора, строить прогнозы развития процессов, обнаруживать связи и различия множества объектов возможно только и исключительно средствами математической статистики.

Статистика позволяет адекватно оценивать складывающуюся ситуацию и выявлять тенденции, принимать оперативные и стратегические решения. В условиях современной рыночной экономики статистическая информация стала важным инструментом борьбы и выживания на рынке. Поэтому пакеты статистического анализа данных являются настольным рабочим инструментом специалистов любого уровня. А для специалиста в области управления и экономики знание статистических методов обработки информации и современных компьютерных технологий, которые позволят автоматизировать громоздкие расчеты, абсолютно необходимы.

Современный экономист должен владеть несколькими основными программными средствами, в которых заложены методы статистического анализа. MS Excel предлагает широкий диапазон средств для анализа статистических и экспериментальных данных. В группу статистических функций входят функции корреляционного анализа. Кроме встроенных средств можно использовать надстройку Пакет анализа (Сервис/Надстройки/Пакет Анализа) для проведения регрессионного и дисперсионного анализа.

MathCad также имеет развитый аппарат работы с задачами математической статистики и обработки эксперимента. Во-первых, имеется большое количество встроенных специальных функций, позволяющих рассчитывать плотности вероятности и другие основные характеристики основных законов распределения случайных величин. Наряду с этим, в MathCad запрограммировано соответствующее количество генераторов псевдослучайных чисел для каждого закона распределения, что позволяет эффективно проводить моделирование методами Монте-Карло. Во-вторых, предусмотрена возможность построения гистограмм и расчета статистических характеристик выборок случайных чисел и случайных процессов, таких как средние, дисперсии, корреляции и т. п. При этом случайные последовательности могут как создаваться генераторами случайных чисел, так и вводиться из файлов. В-третьих, имеется целый арсенал средств, направленных на интерполяцию-экстраполяцию данных, построение регрессии по методу наименьших квадратов, фильтрацию сигналов. Наконец, реализован ряд численных алгоритмов, осуществляющих расчет различных интегральных преобразований, что позволяет организовать спектральный анализ различного типа.

Однако ведущим пакетом статистического анализа является система STATISTICA, которая основана на самых современных технологиях, полностью соответствует последним достижениям в области IT, позволяет решать любые задачи в области анализа и обработки данных, идеально подходит для применения в любой области: маркетинге, финансах, страховании, экономике, бизнесе, промышленности, медицине и др. Например, решение поставленных в начале статьи задач, может быть реализовано на базе промышленных модулей STATISTICA (карты контроля качества, планирование экспериментов, анализ процессов).

1. Теоретические сведения

1.1 Статистика. Виды статистического анализа

Статистика – наука о сборе, измерении и анализе массовых количественных данных. Статистические данные всегда являются приближенными, усредненными. Поэтому они носят оценочный характер и для достоверности результатов необходимо большое число исходных данных.

Существует несколько видов статистического анализа данных: корреляционный, регрессионный, дисперсионный, факторный, кластерный и др. Рассмотрим некоторые из них.

Корреляционный анализ

Иногда корреляцию и регрессию рассматривают как совокупный процесс статистического исследования. Корреляционно-регрессионный анализ является одним из значимых методов построения математических моделей в экономике и считается одним из главных методов в маркетинге.

Корреляция в широком смысле слова означает связь между объективно существующими явлениями.

Корреляционный анализ – вид статистического анализа, который состоит в количественной оценке силы и направления связи между двумя (парная корреляция ) или несколькими (множественная корреляция ) наборами данных. Для количественной оценки силы связи используются коэффициенты парной корреляции r и множественной корреляции R .

Коэффициент корреляции (безразмерная величина) – количественный показатель линейной связи между двумя или более наборами данных, значение которого лежит в интервале от -1 до 1. Если коэффициент равен ± 1, то связь функциональная, если равен 0, то связь отсутствует.

Для качественной оценки силы связи используются специальные табличные соотношения (например, шкала Чеддока, табл. 1)


Таблица 1 – Шкала Чеддока

Значения коэффициента корреляции Характер связи
Очень слабая
Слабая
Заметная
Сильная
Очень сильная

Направление связи определяется знаками ±: близость к +1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, близость к -1 означает обратное.

Для наглядности измерения всех связей в случае множественной корреляции целесообразно использовать корреляционную матрицу – матрицу из попарных коэффициентов корреляции.

Регрессионный анализ

Регрессионный анализ – вид статистического анализа, который состоит в представлении зависимости одних факторов от других в виде некоторой функции (уравнения регрессии ) с помощью которой осуществляется прогнозирование и поиск ответа на вопросы «Что будет через какое-то время?» или «Что будет, если…?».

В случае парной регрессии уравнение определяется подвум наборам данных, один из которых представляет значения зависимой переменной y , а другой – независимой переменной х . В случае множественной регрессии уравнение определяется по нескольким наборам данных, один из которых представляет значения зависимой переменной y , а другие независимыми переменными х1 , х2 ,…, xm .

Получение уравнения регрессии происходит в два этапа: подбор вида функции и вычисление параметров функции.

Выбор функции, в большинстве случаев, производятся среди линейной, квадратичной, степенной и др. видов функций (табл. 2). К функции предъявляются следующие требования: она должна быть достаточно простой для использования ее в дальнейших вычислениях и график этой функции должен проходить вблизи экспериментальных точек так, чтобы сумма квадратов отклонений y -координаты всех экспериментальных точек от y -координат графика функции была ба минимальной (метод наименьших квадратов).

Таблица 2 – Виды функций, применяемых в регрессионных моделях

Парная (простая) регрессия Множественная регрессия
Линейная регрессия
y=ax+b, y = а0 + a1 x1 + … +am xm
Квадратичная (параболическая)
y=ax2 +bx+c y= а0 + a1 x1 2 + … +am xm 2
Степенная
y=axb y = а0 x1 a1 x2 a2 … xm am
Логарифмическая y=alnx+b,

Гиперболическая

y = а0 + a1 (1/x1 ) + … +am (1/xm )

Экспоненциальная y=aebx
где a, b, c – коэффициенты парной регрессии.

где а0 , a1 ,a2 ,…,am – коэффициенты множественной регрессии,

n – объем совокупности,

m – количество факторных признаков.

? Какой вид регрессионного анализа (парный или множественный) в большей степени отвечает реальным условиям?

? Можно ли учесть все факторы х1 , х2 ,… , xm , … в случае множественной корреляции?

Для количественной оценки точности построения уравнения регрессии предназначен коэффициент детерминации R2 , равный квадрату коэффициента корреляции и указывающий, какой процент изменения функции у объясняется воздействием факторов хk . Чем его значение ближе к 1, тем уравнение точнее описывает исследуемую зависимость.