Смекни!
smekni.com

Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы (стр. 9 из 11)

- 1-й уровень.

Обозначим доли испытуемых, как

и
.

Группы

и
мы выбираем методом крайних групп. Как правило, берут от 10 до 30% лучших и худших по результатам выполнения всего теста. В данной ситуации мы выберем 30% испытуемых из сильной группы и 30% испытуемых из слабой группы, которые наиболее успешно справились со всем тестом (т.е. с самым высоким тестовым баллом).

Рассмотрим ситуацию, когда

и
принимают предельные значения.

Если

, то это значит, что задачу не решил никто.

Если

, то это значит, что задачу решили все.

В таких ситуациях можно сделать вывод, что задачи являются неправильными. Такие задачи, либо надо убирать из теста, либо дорабатывать.

Для задач первого уровня:

,
,

то есть, значения долей испытуемых из сильной и слабой групп примерно равны единице. Это значит, что задачу решили почти все испытуемые. А индекс дискриминации примерно равен нулю. Также должно выполняться условие, что показатель трудности более 50%.

Рассмотрим это на примере теста диагностики ИП (2-й срез, задача 5-1-1). Количество испытуемых

, при делении на слабую и сильную группы в сильной оказалось 44 человека, в слабой – 404. Методом крайних групп из сильной группы остается 13 человек, из слабой - 121 человек. Из сильной группы задание решило 10 человек, из слабой группы задание решило 81 человек. Таким образом,

.

Трудность задания более 50%. Все условия для задачи первого уровня выполняются. Значит, задача действительно является задачей 1-го уровня.

Для задач второго уровня:

,
,

то есть доля испытуемых сильной группы близка к единице, а доля испытуемых слабой группы больше одной второй. Это значит, что задачу решили почти все испытуемые из сильной группы и больше половины, испытуемых из слабой группы. А индекс дискриминации будет принимать значения больше нуля, но меньше одной второй. Показатель трудности должен принимать значения в диапазоне от 10% до 50%.

Рассмотрим это на примере теста диагностики ИП (2-й срез, задача 6-6-2). Количество испытуемых

, при делении на слабую и сильную группы в сильной оказалось 44 человека, в слабой – 404. Методом крайних групп из сильной группы остается 13 человек, из слабой - 121 человек. Из сильной группы задание решило 9 человек, из слабой группы задание решило 63 человек. Таким образом,

.

Трудность задания от 10% до 50%. Все условия для задачи второго уровня выполняются. Значит, задача действительно является задачей 2-го уровня.

Для задач третьего уровня:

,
,

то есть доля испытуемых сильной группы больше нуля, но меньше или равна одной второй, а доля испытуемых слабой группы близка к нулю (очень мала). Это значит, что задачу решают меньше половины испытуемых из сильной группы и почти не решают испытуемые из слабой группы. Индекс дискриминации будет принимать значения больше нуля, но меньше одной второй. Показатель трудности должен быть менее 10%.

Рассмотрим это на примере теста диагностики ИП (2 срез, задача 6-7-3). Количество испытуемых

, при делении на слабую и сильную группы в сильной оказалось 44 человека, в слабой – 404. Методом крайних групп из сильной группы остается 13 человек, из слабой - 121 человек. Из сильной группы задание решило 6 человек, из слабой группы задание решило 12 человек. Таким образом,

.

Трудность задания менее 10%. Все условия для задачи третьего уровня выполняются. Значит, задача действительно является задачей 3-го уровня.

Вывод: мы выделили дополнительный критерий для подтверждения уровней задач в тесте диагностики ИП и показали на примерах, что этот критерий действительно подтверждает уровни задач.

§3.4 АНАЛИЗ РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ЗАДАНИЙ ТЕСТА ДИАГНОСТИКИ ИНДИВИДУАЛЬНОГО ПРОГРЕССА

Нами была проведена статистическая обработка результатов теста диагностики индивидуального прогресса по двум срезам. Мы провели оценку качества заданий выделенными нами методами оценки валидности, надежности, дифференцирующей способности, а также подтвердили уровни заданий, с помощью выделенного дополнительного критерия. Проанализируем результаты оценки качества заданий.

Расчет тесноты связи заданий по формуле Пирсона показал, что, действительно, связь между уровневыми заданиями сильная. Это говорит о том, что задания теста являются валидными.

Расчет надежности по формуле Кюдера-Ричардсона показал, что оценка этим способ является удовлетворительной, то есть задания теста диагностики ИП являются надежными. Рассмотрим результаты обработки в таблице 4

Таблица 4. Результаты обработки.

ЭтапыХарак-ки 1-й срез вывод 2-й срез вывод
Теснота связи заданий м/у одноур. зад-ми
связь слабая
связь слабая
м/у разноур. зад-ми
связь сильная
связь сильная
Надежность
удовлетворительная
удовлетворительная
Дискриминативность
задача хорошо разделяет испытуемых с высокими и низкими оценками по всему тесту
задача хорошо разделяет испытуемых с высокими и низкими оценками по всему тесту

Из таблицы видно, что задания теста являются качественными.

Подтверждение уровней заданий является одним из центральных моментов обработки теста диагностики ИП. Подсчет коэффициента дискриминативности методом крайних групп с учетом интерпретации результатов вычисления приведенных в предыдущем параграфе, показал, что уровни заданий действительно подтверждаются.