Смекни!
smekni.com

Л. П. Качалова доктор педагогических наук, профессор кафедры педагогики и психологии (стр. 25 из 29)

После выдачи экзаменационного мате­риала и окончания инструктажа организа­тор в аудитории отмечает время начала Единого государственного экзамена.

При проведении ЕГЭ выпускники, при­шедшие на экзамен, обязаны выполнять указания организаторов. Запрещаются разговоры, вставания с мест, пересажива­ния без разрешения организаторов, обмен тестами и бланками ответов. Категорически запрещено пользование мобильными телефонами или иными средствами связи. При нарушении этих требований органи­заторы вправе удалить нарушителя с экзамена.

В ходе экзамена паспорт (удостоверение личности) должен находиться в раскрытом виде перед выпускником рядом с бланками ответов. Организаторы в аудитории, проходя по рядам, проверяют соответствие данных в удостоверении личности с аналогичными данными в бланке регистрации.

Выполнив задания, каждый выпускник должен сдать все бланки ответов, тесты и черновики.

При сдаче бланков учащиеся предъявляют организаторам свой пропуск, на кото­ром делается отметка о прохождении экза­мена (ставится печать образовательного учреждения или штамп «Бланки ЕГЭ сданы»). Организатор в аудитории должен поставить в специальные поля пропуска спою подпись, если учащийся не сдал на проверку какой-либо бланк.

ЕГЭ в различных системах оценивания. Шкала оценки результатов ЕГЭ

Все варианты Единого экзамена состоят из двух частей: базовой и конкурсной. Более трудные задания (например, почти все задания типа «С») собраны во второй части. Для получения «тройки» достаточно успешно выполнить только первую часть. При этом достаточно примерно 60% решенных заданий из первой части.

Результаты сдачи ЕГЭ учащимися оцениваются баллами (по стобалльной системе) и отметками (по пятибалльной системе).

Проблема шкалирования является одной из центральных в системе методического обеспечения ЕГЭ.

В 2001-2003 гг. результаты ЕГЭ обрабатывались в соответствии с моделью шкалирования, разработанной в Центре тестирования Минобразования России (ЦТМО) — организации, ответственной за технологию проведения ЕГЭ (Нейман, 2002). В едином методическом центре в Москве из регионов соби­раются все протоколы экзамена по каждому предмету и для каждо­го протокола (ответов одного учащегося) подсчитываются так назы­ваемые «первичные» (или «сырые») баллы ЕГЭ.

После подсчета первичных баллов производится пересчет в стандартизированные, так называемые «тестовые баллы», которые измеряются по 100-балльной шкале. При этом применяется однопараметрическая модель Раша в модификации Ю.М. Неймана, которая позволяет сохранить монотонность преобразования первичных баллов в стандартизированные, несмотря на взвешивание эмпирической трудности заданий. Такая калибровка дает эффект нормализации распределения баллов.

Для стобалльной шкалы тестовых баллов предметная ко­миссия Минобразования разрабатывает рекомендации по перево­ду в пятибалльные отметки. Наибо­лее ценным следствием этого подхода для практиков явился тот факт, что определенным отрезкам шкалы тестовых баллов факти­чески поставлены в соответствие определенные вероятности эм­пирической встречаемости учащихся с определенным уровнем подготовки. Это облегчает приемным комиссиям вузов планирова­ние приема по результатам ЕГЭ. Вот как примерно выглядит соот­ветствие между определенными точками на шкале тестовых бал­лов ЕГЭ и процентильными баллами (процентами от выборки испы­туемых, выполнявших тест):

Ниже 30 Ниже 40 Выше 50 Выше 60 Выше 70
Менее 10% Менее 25% 50% Менее 25% Менее 10%

Однако не все выглядит так просто, как это сформулировано в таблице. На самом деле особенности алгоритма шкалирования, применяемого Центром тестирования, таковы, что этот алгоритм дает в случае различных предметов определенные (хотя иногда и малозначительные) отклонения распределения тестовых баллов от того, что мы видим в таблице.

Было бы еще более разумным шагом не ограничиваться в свидетельствах о результатах ЕГЭ двумя числами (первичным и тестовым баллом), но указать и третье число – «рейтинг-балл», определяющий место, который занял данный экзаменующийся среди всех учащихся в России в текущем году.

Предложенный нами подход несомненно улучшил бы понимание результатов ЕГЭ самыми широкими категориями пользователей – от учащихся, родителей, школьных учителей до работников приемных комиссий вузов.

Возникает очевидное противоречие между выбранным подходом к шкалированию результатов ЕГЭ и требованиями теории на фоне явного непонимания подхода со стороны пользователей в силу его расхождения с массовыми представлениями о тестовых шкалах.

Структура и содержание контрольных измерительных материалов для проведения ЕГЭ

Основным рабочим инструментом единого экзамена являются контрольные измерительные материалы – тесты, содержащие достаточно большое число разнообразных заданий, предполагающих ответы на них в специфической (удобной для компьютерной обработки) форме. В структуре и содержании измерительных материалов должны быть заложены возможности при последующей проверке и обработке результатов ответить на следующие вопросы.

1. Уровень овладения выпускником учебным материалом, предусмотренным государственным образовательным стандартом. При этом контрольные измерительные материалы обязательно должны учитывать все компоненты проверки педагогической триады (ЗУН).

2. Уровень владения выпускником стандартным и творческим компонентами программы. Степень развития творческих способностей особенно интересует приемные комиссии вузов, и в основном этот пункт вызывает значительное число их претензий к единому экзамену.

3. Полнота контрольных измерительных материалов. Иными словами, они должны обеспечить полное, без пробелов «покрытие» образовательного стандарта.

4. Надежность контрольных измерительных материалов. Это значит, что измерительные материалы должны содержать несколько избыточный запас вопросов (задач, примеров и т.п.) для дублирования наиболее важных тем программы, чтобы случайные мелкие неудачи не могли принципиально повлиять на ре­зультат экзамена.

5. Дифференцирующая способность контрольных измерительных материалов. Они должны быть составлены так, чтобы обеспечить статистически значимую дифференциацию выпускников по уровню их подготовленности. Это значит, что на стадии проектирования измери­тельных материалов должны быть предусмотрены возможности получения (после статистической обработки) явно выраженных групп «слабо», «средне», «хорошо» и «очень хорошо» подготовленных выпускников.

Следовательно, простой обзор требований, предъявляемых к контрольным измерительным материалам, показывает, что это совершенно новый «продукт» в школьной практике. Со­ставление качественных измерительных материалов под силу лишь высококвалифицированным научно-педагоги­ческим коллективам, которые должны в совершенстве владеть основами тестологии, уметь учитывать психоло­гические, физиологические, возрастные и прочие особен­ности школьников, хорошо представлять дальнейшую процедуру математической статистической обработки результатов

Объект измерения в едином государственном экзамене и его статистическая природа

Что мы хотим измерять в процессе единого экза­мена? Тривиальный ответ на этот вопрос состоит в сле­дующем: мы хотим измерить уровень образованности человека в различных предметных областях. Но «уровень образованности» — это не длина или ширина, для измерения которых суще­ствует эталонный метр. «Уровень образованности» проявляется в вероятности правильного ответа на конкретный вопрос теста.

Если нескольким испытуемым предложить одну и ту же группу контрольных вопросов (тест) в некоторой предметной области, то результат такого теста окажется следующим. Если тест репрезентативен, то число верных ответов будет больше у того испытуемого, чей уро­вень образованности в этой предметной области выше. В противном случае особого доверия к результату нет, он может быть следствием множества других факторов, вли­яющих на исход теста. На успех или неуспех каждого отдельного ответа влияют (кроме уровня образованности) еще мно­жество других факторов: пробелы в знаниях именно по этому частному вопросу, сиюминутная забывчивость, состояние стресса на экзамене, плохое самочувствие в данный момент и т.д. и т.п. Именно поэтому мы говорим о вероятностной природе измеряемого объекта. Но при достаточно большом числе отдельных испытаний зако­номерность пробьет себе дорогу и проявится в заметном (статистически значимом) превосходстве одного испы­туемого над другим.

Первичный и тестовый баллы

Итак, основным рабочим инструментом в процессе единого экзамена, измеряющим уровень подготовленно­сти выпускников, являются тесты (контрольные измери­тельные материалы). Тесты различаются по вариантам, а задания внутри теста — по типам (способам указания ответов на вопросы задания) и по уровню трудности. Большая часть заданий теста проверяется автоматически. В резуль­тате такой проверки подсчитывается общее число баллов за выполненную работу. Это число называется первичным баллом. По величине первичных баллов уже можно со­ставить простейший рейтинговый список учащихся шко­лы, района, города и т.п. Но это еще не окончательная оценка (тестовый балл)!

Пересчет первичных баллов в тестовые необходим по следующим причинам.

Во-первых, первичная шкала нелинейна. Это означает следующее. Предположим, что максимально воз­можный первичный балл равен, например, 62. Учащийся А набрал 20 баллов, а учащийся В - 50. Чтобы учащемуся А улучшить свой результат на 10%, нужно набрать дополнительно 2 балла, а учаще­муся В для достижения такого же прироста результата - 5 баллов. Причем учащемуся А достаточно всего лишь дополнительно ре­шить пару легких задач, а учащийся В должен увеличивать число баллов за счет выполнения трудных заданий (ведь все легкие он уже решил). Это несправедливо! Такие шкалы, расстояния между метками которых имеют различный вес в начале и в конце шкалы, математики называют нелинейными.