Накопление результатов тестирования учащихся в компьютерных базах данных позволит формировать банки результатов тестирования, что обеспечит возможность многоаспектного статистического анализа состояния системы образования и позволит:
- оценивать работу отдельных образовательных учреждений и территориальной системы НПО-СПО в целом;
- осуществлять контроль экспериментального внедрения инновационных технологий обучения;
- осуществлять сравнительный анализ эффективности различных программ и учебных пособий.
Педагогические тесты: тесты достижений или тесты успешности
А.Н. Майоров[1] классифицирует педагогические тесты по нескольким основаниям. В частности, кроме уже упоминавшихся стандартизированных тестов он выделяет так называемые нестандартизированные тесты. Автор считает, что в педагогике можно выделить ряд задач, которые могут быть решены при помощи тестов, не стандартизированных по результатам, и называет такие тесты ненормированными. Однако он настаивает на том, что «сфера применения ненормированного инструмента ограничена: с точки зрения субъекта - разработчиком теста, а объекта - той группой учеников, с которыми он в состоянии работать. Круг задач для ненормированных тестов — частные, специальные методические и узкометодические. Например, оценка качества усвоения материала той или иной темы, выявление усвоенных понятий, определений данной темы и т.д.». Иными словами, каждый педагог может составить тестовый вопрос для применения на своем занятии с целью оптимизировать процесс контроля или формирования знаний, умений, освоения обучаемыми способов деятельности.
В отличие от требования стандартизации по результатам, требование стандартизации по процедуре проведения теста и оценке тестов достижений остается обязательным вне зависимости от широты поставленной задачи.
По назначению различают общедиагностические (например, тесты общего интеллекта Векслера); профессиональной пригодности (общий армейский классификационный тест); специальных способностей (технических, музыкальных, тесты для пилотов); тесты достижений (например, произношения, качества написания сочинений, решения геометрических задач и т.п., т.е. тесты, предназначенные для оценивания результатов, достигнутых обучаемыми в процессе обучения).
По средствам, используемым в процессе тестирования: бланковые (тесты «бумага и карандаш», большинство тестов школьных достижений и др.); предметные (в которых необходимо манипулировать материальными объектами, «Сложение фигур» из набора Векслера и др.); аппаратурные (тесты с использованием устройств для изучения особенностей внимания, восприятия, памяти и мышления — «детектор лжи», аппарат для определения энцефалограмм мозга и др.); практические (эти тесты похожи на известные у нас лабораторные работы - по химии, физике, биологии и пр., однако они снабжены соответствующими инструкциями и имеют тестовое оснащение).
По количеству одновременно обследуемых людей: групповые (большинство тестов достижений) и индивидуальные.
По форме ответа тесты делятся на устные и письменные.
По ведущей ориентации:
тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время («шифровка» из набора Векслера);
тесты мощности или результативности, включающие трудные задачи, время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы, учреждений профессионального образования;
смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточно для решения предлагаемых задач большинством обследуемых. Оценке в данном случае подлежат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения. Эти тесты наиболее часто применяются на практике, и именно к ним относится большинство тестов школьных достижений.
По степени однородности задач: гомогенные, которые включают задачи, сходные по характеру, но различающиеся конкретным содержанием, и гетерогенные (многоразмерные), которые включают задания, отличающиеся как по характеру, так и по содержанию. К этим заданиям также относятся современные тесты достижений.
По виду нормирования: ориентированные на статистические нормы - тесты, основанием для сравнения в которых служат соответствующим образом обоснованные статистически полученные значения (результаты) выполнения данного теста репрезентативной выборкой испытуемых; критериально ориентированные — тесты, предназначенные для определения уровня индивидуальных достижений испытуемого относительно некоторого заданного критерия, существующего в реальной практике и заранее известного: уровня знаний, умений, способов, необходимых для выполнения определенного вида деятельности. Критерий может быть определен на основании экспертной оценки (путем опроса педагогов, работающих в данном классе или с данной группой обучаемых) либо практической деятельности испытуемых (критерий успешности может быть определен по оценкам за семестр или год); прогностические, ориентированные на успешность дальнейшей деятельности; ненормированные.
По характеру ответов на вопросы: открытого типа и закрытого типа. Рассмотрим принципы отбора заданий закрытого типа и композиции тестов.
Задания с выбором одного правильного ответа из двух предложенных вариантов (true/false item)
Задания с выбором одного правильного ответа из двух предложенных вариантов требуют одного варианта ответа, например "да" - "нет", "верно" - "неверно".
При конструировании таких вопросов используется один из основных композиционных принципов:
1) принцип противоречия (подбираются варианты ответа, являющиеся отрицаниями друг друга);
2) принцип полярности (да и нет). Наряду со строгими отрицаниями допустим подбор ответов, которые, являясь антонимичными по смыслу, допускают существование переходных понятий (состояний): убывающая - возрастающая; периодическая - непериодическая; выпуклая – вогнутая; положительные – отрицательные;
3) принцип однородности (подбираются такие два ответа, которые относятся к одному роду, виду или отображают 2 основные стороны (грани) явления, например, слова, противоположные по смыслу: синонимы – антонимы;
4) принцип кумуляции (содержание второго ответа вбирает в себя содержание первого).
Достоинствами тестовых вопросов с выбором ответа из 2-х предложенных вариантов являются:
- краткость и ясность заданий,
- простота инструкций;
- высокая технологичность,
- быстрота тестирования;
- опора конструкции теста на законы формальной логики (закон противоречия, закон исключенного третьего).
Недостатками данной тестовой конструкции являются относительно высокая вероятность угадывания правильного ответа (1/2), возможность запоминания правильного ответа (ввиду ограниченности предлагаемых вариантов), быстрое рассекречивание (тестируемые передают друг другу содержание запомнившихся заданий и ответы на них).
Тестовые вопросы данного типа целесообразно использовать для экспресс-диагностики, входного (предварительного) контроля, самоконтроля (с целью обнаружения пробелов в знаниях), для устного группового опроса, т.е. в тех ситуациях, когда «точность оценки играет меньшую роль, чем быстрота тестирования»[2]. Однако не исключается возможность использования тестовых вопросов с выбором одного правильного ответа из двух предложенных вариантов для итогового контроля по целому ряду дисциплин (математика, физика, биология, химия, грамматика) в составе батареи тестов[3]. С помощью вопроса такого типа разработчик быстро и эффективно отсекает одну из причин неудачного выполнения всей батареи тестов – неспособность тестируемого продемонстрировать умение или совершить деятельность из-за отсутствия необходимых знаний.
Приведем пример:
Для приготовления бисквитного теста следует использовать муку с содержанием слабой клейковины около 30%.
Да Нет
Задания с выбором одного правильного ответа из предложенных вариантов
(multiple choice questions)
Существует мнение, что тестовые вопросы с выбором одного верного ответа из четырех предложенных вариантов предпочтительнее тестовых вопросов, предполагающих выбор ответа из двух-трех вариантов. Однако практика показывает, что надежность задания определяется не количеством дистракторов[4], а их качеством, т.е. правдоподобностью по сравнению с правильным ответом. В идеале выбор любого дистрактора и правильного ответа должен быть равновероятны. Сферы применения совпадают с заданиями с выбором одного правильного ответа из двух предложенных вариантов.
Приведем примеры:
1. Определите расход краски Capadecor Arte-Lasur Color при окраске поверхностей помещения площадью 66,5 м2 в два слоя, если расход краски на 1 м2 – 130 г.
1) 17,29 кг
2) 17,50 кг
3) 17,85 кг
4) 18,00 кг
2. Выберите захват, удерживающий поднимаемый элемент за счет трения и позволяющий кантовать длинномерные элементы (колонны):