Педагогическое тестирование в России и США (стр. 2 из 4)

Единый государственный экзамен по каждой дисциплине должен состоять из двух частей. Первая часть (А) — это аттестационный экзамен по курсу X—XI классов, обязательный для всех учащихся. Имеются два варианта аттестации: А1 — контроль обязательного уровня подготовки выпускников и А2 — повышенного уровня. Результат тестирования переводится в 5-балльную шкалу для отметки в аттестате. Вторая часть (В) — по желанию выпускников для поступления в вузы, состоящая также из вариантов В1 (базовый уровень) и В2 (повышенный уровень). По совокупным ответам на задания частей А (А1 или А2) и В (В1 или В2) выдается сертификат единого государственного экзамена с оценкой по 100-балльной шкале для поступления в вузы.

При проведении аттестационного тестирования необходимо определить минимальный набор совокупности учебных элементов содержания образования. Это можно сделать с помощью структурно-логических схем и матриц логической связи, которые решают задачу формирования минимально полного набора базовых учебных единиц, удовлетворяющих свойствам полноты и минимальности. На основе подобных идей реализуется основной принцип формирования единого банка тестовых заданий — возможно полное и подробное отражение содержания предмета его логической структурой. В связи с этим решается задача создания перечня обобщенных видов умений по каждой дисциплине, обладающих свойствами полноты и минимальности. В соответствии с этим принципом в Центре тестирования Минобразования РФ сформированы обобщенные умения по географии, физике, истории и химии.

Возможен "тезаурусный подход" к определению содержания обучения, основанный на разработке базовых понятий соответствующих учебных дисциплин и специальностей. В педагогических исследованиях чаще встречаются два типа тезаурусов — "информационно-поисковый" (Л.Т.Турбович. 1970) и "логико-категориальный" (Л.В.Макарова. 1992). Первый тип делит множество учебных понятий на отдельные области, а второй устанавливает между ними логические и функциональные взаимные связи. Предлагается методика составления информационно-поискового тезауруса на основе классификатора знаний и способностей Б.Блума — Р.Гегна. дополненного В.С.Аванесовым [9]. В частности, разработаны два классификатора знаний по биологии, содержащие знания "дифференциального" и "интегрального" типов. Первый из них. основываясь на типологии мыслительных операций, содержит группы фактуальных. сравнительных, ассоциативных, причинных, алгоритмических, классификационных, системных, метрологических и методических знаний. Второй на основе деятельностного подхода содержит "житейские", мировоззренческие, технологические, математические, кибернетические, квалитативные и акмеологическне знания. Анализ репетиционных тестов по биологии позволил авторам диагностировать в них 30% фактуальных знаний (термины, определения, исторические факты и достижения ученых, законы и закономерности). 20% классификационных знаний (основные признаки растений и животных, их систематическое положение и морфологическое описание) и 16% причинных знаний (причинно-следственные отношения). Мало внимания уделяется диагностике алгоритмических (10%), ассоциативных (5%) и сравнительных (3%) знании. Таким образом, педагогическое тестирование, основанное на таксономической модели уровней обученное™ [10] и классификаторе знани! и способностей, наиболее полно удовлетво ряет требованиям государственных образовательных стандартов.

Что касается проблемы психологической диагностики абитуриентов на предполагаемом втором туре абитуриентского тестирования в конкретном учебном заведении, тс здесь вдобавок к сертификату выпускника средней школы предлагается психофизиологическое обследование абитуриентов е вузе по факторам, связанным со свойствами нервной системы и когнитивными психическими функциями — памятью, вниманием, особенностями восприятия и мышления [11. с. 51—52]. Например, в технических вузах целесообразно оценивать психологические предпосылки к обучению и профессиональному становлению студентов на основании теста технического интеллекта в экономических — теста социального интеллекта Дж. Гилфорда, в гуманитарных — теста вербального интеллекта Дж.Айзенка. Для диагностики развития приемов мыслительной деятельности используются специфические тестовые задания с помощью применения аналогий, исключения лишнего и т.п. Кроме того, полезно разрабатывать методы оценки конкретных профессионально значимых качеств личности абитуриента в соответствии с его будущей профессиональной деятельностью.

Отечественная система образования весьма специфична, поэтому научные и прикладные наработки мировых лидеров по педагогическому тестированию в нашей! стране однозначно не адаптируются, что служит основанием для развития не только прикладных разработок, но и теоретических исследований в данной области; педагогики. Последнее дополнительно стимулируется наличием у нас большого количества научных работников с хорошей математической подготовкой, способных заняться данной актуальной педагогической проблемой. Отдельную группу здесь составляют работы, выполняемые в рамках теории моделирования и параметризации педагогических тестов. Моделирование педагогических тестов I может осуществляться с пр1шенением двух f теоретических подходов — классической ■ теории и современной теории 1RT (Item

Научные сообщения

Response Theory). Первая с помощью определения показателей надежности и ва-пнпности позволяет сделать оценку качества разработанного теста. Для определения взаимосвязанности заданий в тесте в ней используются методы корреляционного „ факторного анализа. Второй подход основан на методологии латентно-структурного анализа XLSAI_c его мощным математическим аппаратом и имеет больше возможностей по созданию эффективных тестов Так, с помощью модели Г.Раша [12] посредством использования характеристических кривых можно оценивать латентные (скрытые) параметры уровня подготовленности испытуемых и трудности заданий. Разумно составленные варианты теста и статистическая обработка результатов тестирования в рамках данной модели позволяют получать оценки латентных параметров на метрической шкале, однако шкалы, соответствующие различным вариантам теста, отличаются друг от друга. Для их преобразования в единую шкалу необходимо иметь дополнительную информацию, получаемую перекрытием вариантов теста для различных групп участников или перекрытием групп испытуемых, исследуемых различными вариантами теста. Такая дополнительная информация устраняет неопределенность начала отсчета каждой шкалы, соответствующей различным вариантам теста.

Использование двухпараметрнческой модели, предложенной А.Бирнбаумом [13], позволяет определять дифференцирующую способность тестовых заданий. Для обеспечения нормализации их распределения по уровню трудности рассматриваются вопросы аппроксимации логистического распределения тестовых заданий [14. с. 59—61]. При работе с этой моделью неопределенными оказываются не только начала отсчета каждой шкалы, соответствующей различным вариантам теста, но и масштабы таких шкал. Для устранения указанных неопределенностей рекомендуется обеспечивать определенное перекрытие вариантов теста. Обсуждаются структура перекрытия, количество общих заданий — узлов и основные требования к ним. Трехпараметрическая модель А.Бирнбаума позволяет при моделировании тестов учитывать вероятность угадывания ответа на каждое задание. Это повышает эффективность проектирования тестов и ждет своего применения.

Следует отметить, что современная теория измерений различает шкалы номинальные (наименований), порядковые (ранговые), интервалов, отношений (пропорций) и разностей. При измерениях в педагогике чаще всего ограничиваются применением порядковых шкал. Однако в работах Б.П.Битинаса, В.И.Михеева, Л.Т.Турбовича, Л.М.Фридмана, К.Инген-камна и других авторов делаются попытки перехода к интервальным шкалам. Для этого все чаще используются стандартные нормы (z-шкала, с-шкала, т-шкала, р-шка-ла и др.), являющиеся нормированными шкалами на уровне шкал интервалов. В этой связи заметим, что педагогические измерения с помощью традиционной 5-балльной шкалы и тестовых оценок также основаны на порядковых шкалах. Однако перевод латентных параметров в единую метрическую шкалу позволяет перейти от качественных порядковых к количественным квазиннтервальным шкалам и проводить адекватную обработку результатов более мощным математическим аппаратом. Наиболее удобным для оценивания результатов тестирования является 100-балльная т-шкала. в которой в настоящее время стал выставляться сертификационный балл выпускников средних школ при проведении единого государственного экзамена.

Отечественная школа при развитии тестовых измерений показала высокую готовность к использованию информационных технологий на всех этапах разработки и внедрения педагогических тестов. Здесь следует отметить значительные достижения Центра тестирования Минобразования РФ в организации централизованного, абитуриентского и репетиционного тестирования, а также единого государственного тестового экзамена, результатом обобщения которых явилась монографическая публикация [15]. Компьютерные технологии автоматической генерации тестов, проведения и обработки результатов тестирования, региональные и федеральные системы тестирования с использованием всемирной информационно-образовательной среды Интернет возводят педагогическое тестирование в России в разряд современных педагогических технологий и позволяют ему быстрыми шагами приближаться к мировому эталонному уровню.