Смекни!
smekni.com

Психология Немов Р С Книга 3 Психодиагностика (стр. 100 из 115)

Выборочное среднее определяется при помощи следующей формулы:

1 Приводимые здесь определения и высказывания не всегда являются до­статочно строгими с точки зрения теории вероятностей и математической ста­тистики как сложившихся областей современной математики. Это сделано для лучшего понимания данного текста студентами, не подготовленными в облас­ти математики:

560


______ Глава 3. Статистический анализ экспериментальных данных___

где х — выборочная средняя величина или среднее арифметичес­кое значение по выборке; п — количество испытуемых в выбор­ке или частных психодиагностических показателей, на основе ко­торых вычисляется средняя величина; хк— частные значения по­казателей у отдельных испытуемых. Всего таких показателей п, поэтому индекс k данной переменной принимает значения от 1 до п; Е — принятый в математике знак суммирования величин тех переменных, которые находятся справа от этого знака. Выра­жение X хк соответственно означает сумму всех х с индексом k от

1 до п.

Пример. Допустим, что в результате применения психодиаг­ностической методики для оценки некоторого психологическо­го свойства у десяти испытуемых мы получили следующие част­ные показатели степени развитости данного свойства у отдель­ных испытуемых: xi= 5, х2= 4, х3= 5, х4= 6, х5= 7, *6 = 3, х7= 6, х& = 2, хд= 8, хт = 4. Следовательно, п = 10, а индекс k меняет свои значения от 1 до 10 в приведенной выше формуле. Для данной выборки среднее значение1, вычисленное по этой формуле, бу­дет равно:

В психодиагностике и в экспериментальных психолого-пе­дагогических исследованиях среднее, как правило, не вычисля­ется с точностью, превышающей один знак после запятой, т.е. с большей, чем десятые доли единицы. В психодиагностических обследованиях большая точность расчетов не требуется и не име­ет смысла, если принять во внимание приблизительность тех оце­нок, которые в них получаются, и достаточность таких оценок для производства сравнительно точных расчетов.

Дисперсия как статистическая величина характеризует, на­сколько частные значения отклоняются от средней величины в данной выборке. Чем больше дисперсия, тем больше отклонения

1 В дальнейшем, как это и принято в математической статистике, с целью сокращения текста мы будем опускать слова «выборочное» и «арифметичес­кое» и просто говорить о «среднем» или «среднем значении».

561


______ Часть II. Введение в научное психологическое исследование____

или разброс данных. Прежде чем представлять формулу для рас­четов дисперсии, рассмотрим пример. Воспользуемся теми пер­вичными данными, которые были приведены ранее и на основе которых вычислялась в предыдущем примере средняя величи­на. Мы видим, что все они разные и отличаются не только друг от друга, но и от средней величины. Меру их общего отличия от средней величины и характеризует дисперсия. Ее определяют для того, чтобы можно было отличать друг от друга величины, име­ющие одинаковую среднюю, но разный разброс. Представим се­бе другую, отличную от предыдущей выборку первичных значе­ний, например такую: 5, 4, 5, 6, 5, 6, 5, 4, 5, 5. Легко убедиться в том, что ее средняя величина также равна 5,0. Но в данной вы­борке ее отдельные частные значения отличаются от средней го­раздо меньше, чем в первой выборке. Выразим степень этого отличия при помощи дисперсии, которая определяется по следую­щей формуле:




где S — выборочная дисперсия, или просто дисперсия;



— выражение, означающее, что для всех хкот перво-


го до последнего в данной выборке необходимо вычислить раз­ности между частными и средними значениями, возвести эти раз­ности в квадрат и просуммировать;

п — количество испытуемых в выборке или первичных зна­чений, по которым вычисляется дисперсия.


562

Определим дисперсии для двух приведенных выше выборок частных значений, обозначив эти дисперсии соответственно ин­дексами 1 и 2:'


______ Глава 3, Статистический анализ экспериментальных данных___

Мы видим, что дисперсия по второй выборке (0,4) значитель­но меньше дисперсии по первой выборке (3,0). Если бы не было дисперсии, то мы не в состоянии были бы различить данные вы­борки.

Иногда вместо дисперсии для выявления разброса частных дан­ных относительно средней используют производную от дисперсии величину, называемую выборочное отклонение. Оно равно квадрат­ному корню, извлекаемому из дисперсии, и обозначается тем же

самым знаком, что и дисперсия, только без квадрата— S:

Медианой называется значение изучаемого признака, кото­рое делит выборку, упорядоченную по величине данного призна­ка, пополам. Справа и слева от медианы в упорядоченном ряду остается по одинаковому количеству признаков. Например, для выборки 2, 3, 4, 4, 5, 6, 8, 7, 9 медианой будет значение 5, так как слева и справа от него остается по четыре показателя. Если ряд включает в себя четное число признаков, то медианой будет сред­нее, взятое как полусумма величин двух центральных значений ряда. Для следующего ряда 0, 1,1, 2, 3, 4, 5, 5, 6, 7 медиана будет равна 3,5.

Знание медианы полезно для того, чтобы установить, явля­ется ли распределение частных значений изученного признака симметричным и приближающимся к так называемому нормаль­ному распределению. Средняя и медиана для нормального рас­пределения обычно совпадают или очень мало отличаются друг от друга. Если выборочное распределение признаков нормаль­но, то к нему можно применять методы вторичных статистичес­ких расчетов, основанные на нормальном распределении данных. В противном случае этого делать нельзя, так как в расчеты могут вкрасться серьезные ошибки.

Если в книге по математической статистике, где Описывает­ся тот или иной метод статистической обработки, имеются ука­зания на то, что его можно применять только к нормальному или близкому к нему распределению признаков, то необходимо не-

563


______ Часть II. Введение в научное психологическое исследование___

укоснительно следовать этому правилу и полученное эмпиричес­кое распределение признаков проверять на нормальность. Если такого указания нет, то статистика применима к любому распре­делению признаков. Приблизительно судить о том, является или не является полученное распределение близким к нормальному, можно, построив график распределения данных, похожий на те, которые представлены на рис. 72. Если график оказывается бо­лее или менее симметричным, значит, к анализу данных можно применять статистики, предназначенные для нормального рас­пределения. Во всяком случае, допустимая ошибка в расчетах в данном случае будет относительно небольшой.

Приблизительные картины симметричного и несимметрич­ного распределений признаков показаны на рис. 72, где точками miи т2на горизонтальной оси графика обозначены те величины

признаков, которые соответствуют медианам, а х\ и Х2 — те, ко­торые соответствуют средним значениям.

Рис. 72. Графики симметричного и не­симметричного распределения при­знаков: I — симметричное распределе­ние (все относящиеся к нему элемен­тарные статистики обозначены с по­мощью индекса 1); II — несимметрич­ное распределение (его первичные ста­тистики отмечены на графике индек­сом 2).

Мода еще одна элементар­ная математическая статистика и характеристика распределе­ния опытных данных. Модой называют количественное зна­чение исследуемого признака, наиболее часто встречающееся в выборке. На графиках, пред­ставленных на рис. 72, моде со­ответствуют самые верхние точки кривых, вернее, те значе­ния этих точек, которые распола­гаются на горизонтальной оси. Для симметричных распреде­лений признаков,' в том числе для нормального распределе­ния, значение моды совпадает со значениями среднего и меди­аны. Для других типов распре­делений, несимметричных, это не характерно. К примеру, в по­следовательности значений признаков 1,2, 5,2,4, 2,6,7,2 модой

564


Глава 3. Статистический анализ экспериментальных данных

является значение 2, так как оно встречается чаще других значе­ний — четыре раза.

Иногда исходных частных первичных данных, которые под­лежат статистической обработке, бывает довольно много, и они требуют проведения огромного количества элементарных ариф­метических операций. Для того чтобы сократить их число и вмес­те с тем сохранить нужную точность расчетов, иногда прибегают к замене исходной выборки частных эмпирических данных на интервалы. Интервалом называется группа упорядоченных по ве­личине значений признака, заменяемая в процессе расчетов сред­ним значением.