Тестирование в учебном процессе: его история и возможности (стр. 1 из 2)

Иван Павлович Подласый, профессор, доктор педагогических наук, Челябинский государственный педагогический университет.

Качество обучения напрямую зависит от количества, глубины, своевременности и объективности оценки получаемых знаний. Грамотно составленные тесты позволяют определять уровень усвоения знаний и степень формирования навыков в процессе обучения.

Применение диагностических тестов в зарубежных школах имеет давнюю историю. Признанный авторитет в области педагогического тестирования Э. Торндайк (1874—1949) выделяет три этапа внедрения тестирования в практику американской школы:

1. Период поисков (1900—1915). На этом этапе происходило осознание и первоначальное внедрение тестов памяти, внимания, восприятия и других, предложенных французским психологом А. Бинэ. Разрабатываются и проверяются тесты интеллекта, позволяющие определять коэффициент умственного развития.

2. Последующие 15 лет — годы «шума» в развитии школьного тестирования, приведшие к окончательному осмыслению его роли и места, возможностей и ограничений. Были разработаны и внедрены тесты О. Стоуна по арифметике, Б. Зекингема для проверки правописания, Э. Торндайка по диагностике большинства школьных предметов. Т. Келли разработал способ измерения интересов и наклонностей обучаемых (при изучении алгебры), а Ч. Спирмен предложил общие основы использования корреляционного анализа для стандартизации тестов.

3. С 1931 г. начинается современный этап развития школьного тестирования. Поиски специалистов направляются на повышение объективности тестов, создание непрерывной (сквозной) системы школьной тестовой диагностики, подчиненной единой идее и общим принципах, созданию новых, более совершенных средств предъявления и обработки тестов, накопления и использования диагностической информации.

Напомним в связи с этим, что педагогика, развившаяся в России в начале века, безоговорочно приняла тестовую основу объективного школьного контроля.

После известного постановления ЦК ВКП(б) «О педологических извращениях в системе Наркомпроса» (1936) были ликвидированы не только интеллектуальные, но и безобидные тесты успеваемости. Попытки возродить их в 70-х годах ни к чему не привели. В этой области наша наука и практика значительно отстали от зарубежной.

В школах развитых стран внедрение и совершенствование тестов шло быстрыми темпами. Широкое распространение получили диагностические тесты успеваемости, использующие форму альтернативного выбора правильного ответа из нескольких правдоподобных, написания очень краткого ответа (заполнения пропусков), дописывания букв, цифр, слов, частей формул и т. п. С помощью этих несложных заданий удается накапливать значительный статистический материал, подвергать его математической обработке, получать объективные выводы в пределах тех задач, которые предъявляются к тестовой проверке. Тесты печатаются в виде сборников, прилагаются к учебникам, распространяются на цифровых носителях.

Проблема соотношения устных и письменных форм контроля разрешается в большинстве случаев в пользу последних. Считается, что хотя устный контроль больше способствует выработке быстрой реакции на вопросы, развивает связную речь, он не обеспечивает надлежащей объективности. Письменная проверка, обеспечивая более высокую объективность, кроме того, способствует развитию логического мышления, целенаправленности: обучаемый при письменном контроле более сосредоточен, он глубже вникает в сущность вопроса, обдумывает варианты решения и построения ответа. Письменный контроль приучает к точности, лаконичности, связности изложения мыслей.

В области определения системы оценок (отметок) наблюдается большое разнообразие как в принципах, так и в конкретных подходах, выборе способов оценивания и выставлений оценок. В зарубежных образовательных заведениях практикуются различные системы оценивания знаний, умений, навыков, приняты различные шкалы оценок, включая сто-, двенадцати-, десяти-, двухбалльную и др. Во французском лицее, например, при сдаче выпускных экзаменов результаты определяются по 20-балльной шкале. При этом для каждого предмета устанавливается определенный весовой коэффициент, определяющий значимость данного предмета для избранной обучаемым специальности, профиля или отделения лицея. Благодаря этому оценки по профилирующим предметам приобретают большую весомость.

При значительной децентрализации большинства зарубежных образовательных систем, при условии свободного выбора школой учебных планов и программ, а обучаемыми — учебных предметов редко проводятся централизованные проверки и оценивание знаний, умений. В Великобритании, например, функцию практического контроля за качеством академической подготовки берут на себя университетские комиссии, к которым на период сдачи выпускных экзаменов прикрепляются все грамматические и привилегированные школы, ориентирующиеся в подготовке своих выпускников на дальнейшее университетское образование.

В целом же нужно признать, контроль и учет успеваемости, диагностирование обученности в зарубежных школах носят характер объективной констатации результатов. Он не предполагает заботу о всеобуче. Общепринятый принцип индивидуализации обучения диктует один подход — каждый идет своим путем и темпом, обучается в меру своих возможностей, потребностей, реальных оценок будущего.

До революции в России существовала шестибалльная система оценки знаний с баллами от нуля до пяти. В 1918 г. оценка «0» была упразднена. Но постепенно и оценка «1» стала использоваться все реже, а начиная с 50-х годов все меньше стала использоваться и оценка «2». Пятибалльная система оценок фактически превратилась в трехбалльную, а для большинства обучаемых, которые не могут учиться на «4» и «5», эта шкала стала двухбалльной. Такая оценочная система очень слабо стимулирует учебный труд, «ступенька» между тройкой и четверкой непреодолима для большинства обучаемых.

Однако многие педагоги используют «дополнения» к обычной пятибалльной шкале в виде знаков «плюс», «минус». Реально получается три градации пятерки («пять с плюсом», «пять», «пять с минусом»), три градации четверки (аналогично), три градации тройки и двойки. Получается типичная десятибалльная шкала оценок.

Научно-исследовательские учреждения РАО предложили новые оценочные шкалы, которые проходят экспериментальную проверку в различных регионах страны. Некоторые регионы склонны принять двенадцатибалльную систему оценок, в которой кроме названных десяти баллов существует два экстремальных: балл «1» — «спасайте» — свидетельствует о том, что учащийся требует немедленной индивидуальной помощи или особенного внимания, вплоть до помещения в специальное учебное учреждение; высший балл «12» — экстремальный максимум («ура»), свидетельствующий о появлении способного и чрезвычайно одаренного учащегося, которого следует обучать индивидуально по специальной программе или же в учебном заведении с углубленным изучением предметов.

Тестирование достижений и развития

Слово «тест» английского происхождения и на языке оригинала означает «испытание», «проверка». Тест обученности — это совокупность заданий, сориентированных на определение (измерение) уровня (степени) усвоения определенных аспектов (частей) содержания обучения.

Правильно составленные тесты обученности должны удовлетворять ряду требований. Они должны быть:

относительно краткосрочными, т. е. не требовать больших затрат времени;

однозначными, т. е. не допускать произвольного толкования тестового задания;

правильными, т. е. исключать возможность формулирования многозначных ответов;

относительно краткими, требующими сжатых ответов;

информационными, т. е. такими, которые обеспечивают возможность соотнесения количественной оценки за выполнение теста с порядковой или даже интервальной шкалой измерений;

удобными, т. е. пригодными для быстрой математической обработки результатов;

стандартными, т. е. пригодными для широкого практического использования — измерения уровня обученности возможно более широких контингентов обучаемых, овладевающих одинаковым объемом знаний на одном и том же уровне обучения.

Если в основу классификации тестов положить различные аспекты (компоненты) развития и формирования человеческих качеств, то она будет выглядеть следующим образом:

1. Тесты общих умственных способностей, умственного развития.

2. Тесты специальных способностей в различных областях деятельности.

3. Тесты обученности, успеваемости, академических достижений.

4. Тесты для определения отдельных качеств (черт) личности (памяти, мышления, характера и др.).

5. Тесты для определения уровня воспитанности (сформированности общечеловеческих, нравственных, социальных и других качеств).

Применение тех или иных тестов будет наиболее успешным и обеспечит надежные выводы лишь при условии правильного их сочетания со всеми другими группами тестов. Поэтому тестовые испытания всегда имеют комплексный характер. Делать общие выводы, например, об уровне развития обучаемых на основе применения лишь тестов обученности было бы непростительной ошибкой. Когда ставится задача диагностирования обученности в связи с достижениями и развитием личности, нужно применять соответствующие виды тестовых заданий и предписанные им методики измерения, не забывая о локальном характере диагностирования.

При разработке тестов важно, насколько они соответствуют запроектированным целям обучения, образования, развития обучаемых. Важнейшими критериями диагностических тестов обученности являются действенность (валидность, показательность), надежность (вероятность, правильность), дифференцированность (различимость).

Действенность теста по своему содержанию близка к требованию полноты, всесторонности проверки, пропорционального представления всех элементов изучаемых знаний, умений. Термин «действенность» имеет, как минимум, два синонима — валидность (от англ. valid — имеющий значение, ценный) и показательность, представительность, трактуемые так же, как репрезентативность. Всегда имеется в виду, что составитель теста обязан тщательно изучить все разделы учебной программы, учебные книги, хорошо знать цель и конкретные задачи обучения. Лишь тогда он сможет составить тесты, которые будут действенными для определенной категории обучаемых.