Смекни!
smekni.com

Контрольно-измерительные материалы КИМы и интерпретация результатов тестирования (стр. 6 из 6)

(8)

Интерпретация. Анализ значений коэффициента корреляции в табл. 10 позволяет выделить задания 3 и 8 теста. По данным таблицы, задание 3 отрицательно коррелирует с заданиями 7, 8, 9 и 10 теста. О том, что «виновато» третье, а не другие задания теста, свидетельствует анализ значений коэффициента корреляции в столбцах с номерами семь, девять и десять. В них просматривается только один минус на месте, соответствующем заданию теста 3, которое в свою очередь отрицательно коррелирует с четырьмя заданиями теста.

Аналогичная ситуация наблюдается в столбце, соответствующем заданию 8 теста. Отрицательные значения коэффициента корреляции указывают на определенный просчет разработчиков в содержании заданий 3 и 8 теста. Наиболее распространенная причина – отсутствие предметной чистоты содержания – нередко встречается при разработке самых разных тестов.

Понятно, что предметная чистота – скорее идеализируемое, чем реальное требование к содержанию любого теста. Например, в тесте по физике всегда встречаются задания с большим количеством математических преобразований, в тесте по биологии – задания, требующие серьезных знаний по химии, в тесте по истории – задания рассчитанные на выявление культурологических знании, и т п. Поэтому говорить об отсутствии пересечения содержания заданий одной учебной дисциплины с содержанием другой в чистом виде не приходится. Можно лишь стремиться к тому, чтобы при выполнении каждого задания доминировали знания по проверяемому предмету.

По-видимому, противоположная ситуация наблюдалась в заданиях 3 и 8, отрицательные значения корреляции по которым указывают на отсутствие связи их содержания с содержанием других заданий теста.

Таким образом, задания 3 и 8 для повышения гомогенности содержания необходимо удалить из теста. Конечно, окончательное решение остается за автором, поскольку оно бессмысленно без тщательного анализа содержания заданий теста. Правда, подобное решение об удалении заданий может быть принято в том случае, когда эмпирические результаты собраны по репрезентативной выборке учеников. Если представительность выборки не достигнута, то появление минусов может не отражать ни в коей мере реальную ситуацию с содержанием заданий теста.

Анализ 9-го столбца с максимальной суммой 4,6495, приведенной в конце, указывает на наличие ряда довольно высоких значений коэффициента корреляции (<р98= 0,6124; <р97-0,7638; <р910-0,6667), каждое из которых может получить различную трактовку в зависимости от вида разрабатываемого теста.

Для тематических тестов высокая корреляция между задания ми неизбежна, так как задания отражают слабо варьирующее, исходное содержание, что вполне оправдано назначением теста.

Однако для итоговых тестов высокой корреляции между заданиями по возможности стараются избегать тестов, оценивающих одинаковые содержательные элементы, поскольку вряд ли имеет смысл включать в итоговый тест несколько заданий. Поэтому в итоговых тестах обычно стремятся к невысокой положительной корреляции, когда значения коэффициента варьируют в интервале (0; 0,3) и каждое задание привносит свой специфический вклад в общее содержание теста.

Десятый шаг. На десятом шаге с помощью подсчета значений коэффициента бисериальной корреляции оценивается валидность отдельных заданий теста.

Коэффициент бисериальной корреляции используется в том случае, когда один набор значений распределения задается в дихотомической шкале, а другой – в интервальной. Тогда в качестве показателя связи между распределениями выбирают бисериальный коэффициент. Под эту ситуацию подпадает подсчет корреляции между результатами выполнения каждого задания (дихотомическая шкала) и суммой баллов испытуемых (интервальная или квазиинтервальная шкала) по заданиям теста.

Формула для подсчета, полученная по результатам вывода, имеет вид

(9)

где

— среднее значение индивидуальных баллов испытуемых, выполнивших верно у-е задание теста;
— среднее значение индивидуальных баллов испытуемых, выполнивших неверно у-е задание теста;
— стандартное отклонение по множеству значений индивидуальных баллов;
— число испытуемых, выполнивших верно у-е задание теста;
— число испытуемых, выполнивших неверно у-е задание теста; N — общее число испытуемых,
; и — ордината нормированного нормального распределения в точке, за которой лежит 100% площади под нормальной кривой. ?? ?? ??
?? ??

Вычисление по формуле (9) требует использования специальных таблиц для нахождения ординат стандартной нормальной кривой и определенной математической подготовки.

Интерпретация. Анализ значений коэффициента бисериальной корреляции в табл. 5.11 указывает на два довольно неудачных задания теста. Это те же самые третье

и восьмое
= 0,26] задания. Полученный вывод дает ценную информацию о низкой валидности заданий 3 и 8 теста. Эти задания следует признать неудачными и для улучшения теста их необходимо удалить.

В целом задание можно считать валидным, когда значение

Под этот критерий подпадают все, кроме двух заданий (третьего и восьмого) рассматриваемого примера матрицы теста.

Оценка валидности задания позволяет судить о том, насколько задание пригодно для работы в соответствии с общей целью создания теста. Если эта цель – дифференциация учеников по уровню подготовки, то валидные задания должны четко отделять хорошо подготовленных от слабо подготовленных учеников тестируемой группы.

Решающую роль в оценке валидности задания играет разность

. Чем выше значение этой разности, тем лучше работает задание на общую цель дифференциации испытуемых, выполняющих тест. Значит ??