1. первая случайная величина характеризует испытуемых;
2. вторая случайная величина характеризует задания.
Далее рассмотрим следующие основные понятия статистики. К ним относятся:
1. Среднее значение – сумма всех значений, деленная на их количество
;2. Дисперсия – среднее значение квадрата отклонения
;3. Среднее квадратическое отклонение – квадратный корень из дисперсии
;4. Коэффициент корреляции – отношение корреляционного момента к произведению средних отклонений этих величин
[7].Мы рассмотрели основные понятия статистической теории измерения, которые мы будем использовать далее при анализе методов статистической обработки качества заданий теста. В следующем пункте рассмотрим первичные и вторичные статистические показатели.
2.1.3 Первичные и вторичные статистические показатели
Условно статистические показатели, описанные в классической теории тестирования, мы можем разделить на две группы: первичные (базовые) и вторичные. К первичным относятся те показатели, которые используются в различных статистических методах оценки качества теста. Вторичные показатели – те, которые вычисляются с помощью первичных. Рассмотрим подробнее первичные и вторичные показатели, и разберем на примере, как они вычисляются. Представим результаты выполнения теста ЕГЭ в виде таблицы (таблица 1).
Первичные:
1. Общий тестовый балл
. Получается сложением всех единиц соответствующей строки;2. Средний тестовый балл группы
. Вычисляется как частное суммы всех тестовых баллов и количества испытуемых в группе. ,где
- количество испытуемых. В рассматриваемом примере ;3. Достижение
-го испытуемого . Находится как частное количества правильно выполненных заданий и общего числа заданий. ,где
- количество правильно выполненных заданий, - общее число заданий.4. Среднее достижение группы
- частное от суммы всех достижений группы на общее число испытуемых. ,в нашем примере
.5. Отклонение достижения каждого учащегося от достижения группы
- разность среднего достижения группы и достижения -го испытуемого.Также первичные показатели характеризуют достижения испытуемых, на основании которых делаются выводы об уровне усвоения материала и качестве его усвоения на этом уровне.
Далее рассмотрим вторичные показатели:
1. Среднее отклонение достижений испытуемых
. Вычисляется по формулев нашем примере
.Таблица 1. Вычисление первичных и вторичных показателей.
Испы-туемые | Задания | Общий тестовый балл Х | Достижение | Отклонение | |||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||||
1 | 1 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 5 | 0,5 | 0,06 |
2 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 4 | 0,4 | 0,16 |
3 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 1 | 5 | 0,5 | 0,06 |
4 | 1 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 8 | 0,8 | 0,24 |
5 | 0 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 4 | 0,4 | 0,16 |
6 | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 1 | 1 | 7 | 0,7 | 0,14 |
7 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 6 | 0,6 | 0,04 |
8 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 1 | 8 | 0,8 | 0,24 |
9 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 4 | 0,4 | 0,16 |
10 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | 5 | 0,5 | 0,06 |
11 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 5 | 0,5 | 0,06 |
12 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 6 | 0,6 | 0,04 |
Промежуточные вычисления | |||||||||||||
Расчет первичных показателей | |||||||||||||
Расчет вторичных показателей |
2. Сумма квадратов отклонений от средней арифметической оценки
. Вычисляется по формуле ,для рассматриваемого примера
.3. Дисперсия тестовых результатов
. Вычисляется по формуледля нашего примера
.4. Стандартное отклонение по тесту
. Находится как корень из дисперсии .В нашем случае
5. Коэффициент корреляции
. Существует несколько формул для вычисления коэффициента корреляции, и все они используются в разных статистических методах оценки качества педагогического теста. Мы будем рассматривать эти формулы в процессе анализа методов.6. Коэффициент надежности
. Аналогично, как и с коэффициентом корреляции, в каждом методе используют разные формулы для вычисления коэффициента надежности. Рассмотрим их в процессе анализа методов.Расчет перечисленных показателей также составляет основу методики количественной оценки качества педагогического теста. Как уже отмечалось раньше, с их помощью оцениваются валидность, надежность и дифференцирующая способность, которые являются основными характеристиками качества педагогического теста.
Мы рассмотрели 11 статистических показателей (5 первичных и 6 вторичных), которые используются в классической теории тестирования. Эти показатели мы будем использовать при анализе методов оценки качества педагогического теста. В следующем параграфе мы рассмотрим методы оценки основных характеристик (валидность, надежность, дифференцирующая способность) качества педагогического теста, учитывая рассмотренные выше первичные и вторичные показатели.
§2.2 МЕТОДЫ СТАТИСТИЧЕСКОЙ ОЦЕНКИ КАЧЕСТВА ТЕСТА
Методы оценки основных характеристик теста состоят из двух частей:
A. Вычисление некоторой величины или характеристики;
B. Интерпретация полученного результата, в соответствии с нормой. Норма определяется согласно специфике теста.