— шкала наименований. Она фактически уже не связа- на с понятием «величина» и используется только с целью отличить один объект от другого: номера автомобилей, те-лефонов, применение цифр или букв алфавита для пере-числения пунктов в законах, положениях и т.п.
Теперь, когда мы совершили небольшой экскурс в тео-рию измерений, рассмотрим вопрос о применении шкал измерений в педагогических исследованиях.
Наиболее распространенная мера педагогических оце- нок шкала оценки знаний и умений учащихся в баллах. Школьные оценки (отметки) — удобный аппарат для практики обучения, который выполняет не только оцени-вающие, но и определенные воспитательные функции сти-мулирования одних учащихся, определенного «наказа- ния» других и т.д.
В педагогических исследованиях используются также и другие шкалы балльных оценок. Например, выделив ка- кие-либо уровни сформированности у учащихся опреде-ленных качеств личности или овладения той или иной де-ятельностью, исследователь приписывает этим уровням соответствующие значения баллов: «1», «2», «3» и т.д., или «0», «1», «2»..., что принципиально безразлично. Но ис-пользование балльной шкалы оценок как критерия оценки для педагогических исследований нежелательно, хотя и не исключено. И дело здесь не только в известной необъек-тивности отметок, о чем уже говорилось, но и в свойствах самой шкалы порядка. В этой шкале ничего нельзя сказать о равномерности или неравномерности интервалов между соседними значениями оценок. Мы не вправе, к примеру, сказать о том, что знания учащегося, оцененные на «5», настолько же отличаются от знаний, оцененных на «4», как знания, оцененные на «4», отличаются от знаний, оценен- ных на «3». С тем же успехом можно было бы приписывать баллам значения не «1», «2», «3», «4», «5», а, допустим «1», «10», «100», «1000», «10 000». И поэтому совершенно не-правильно использование так широко применяемой в педа-гогических исследованиях величины среднего балла (по классу, группе учащихся и т.д.), поскольку усреднение предполагает сложение значений величины, а операция суммы на таком множестве (шкале) не может быть корректно (грамот-но) определена. Соответственно не могут быть определены и все остальные арифметические и алгебраические действия.
Поэтому, например, утверждение о том, что знания уча-щихся в экспериментальных классах в среднем на 0,5 балла выше, чем в контрольных, будет неправомочным, некорректным. Тем более некорректно утверждение, встреченное автором в одной из диссертаций, что эффективность экспериментальной методики в 2,6 раза выше контрольной (была произведена оценка по 10-балльной шкале).
Чтобы продемонстрировать, что может получиться с использованием «среднего» балла, приведем такой гипотети-ческий пример. Пусть исследовалась сравнительная эф-фективность двух каких-либо методов обучения, А и В. В обеих группах учащихся — контрольной и эксперимен-тальной — было по 80 человек. Оценки проводились по двум шкалам — пятибалльной и десятибалльной (ведь ко-личество баллов в шкале устанавливается произвольно). При этом будем предполагать, что оценки по десятибалль- ной шкале могут быть пересчитаны в оценки по шкале пя-тибалльной: оценки «10» и «9» будут отнесены к «5», «8» и «7» — к «4» и так далее. Пусть оценки по десятибалльной шкале распределились следующим образом (в числителе будет указано количество учащихся, получивших соответ-ствующую оценку в группе, обучавшейся методом А, в зна-менателе — методом В:
20 0 30 0 20 0 10
«10» ¾ ; «9» ¾ ; «8» ¾ ; «7» ¾ ; «6» ¾ ; «5» ¾ ; «4» ¾ ;
0 30 0 30 0 30 0
оценки «3», «2», «1» не получил никто. Соответственно «средний балл» составит 7,50 (метод А) и 7,25 (метод В). Казалось бы, можно сделать вывод, что метод А лучше ме-тода В. Соответственно оценки по пятибалльной шкале, в
20 30 20 10 0
том же порядке: «5» ¾ ; «4» ¾ ; «3» ¾ ; «2» ¾ ; «1» ¾ .
30 30 20 0 0
«Средний балл» в этом случае составит 3,750 в группе, обучавшейся методом А, и 4,125 в группе, обучавшейся методом В. Таким образом мы получили противополож- ный «результат» — метод В лучше метода А.
Заметим, что этот «парадокс» никак не связан со стати-стической достоверностью различий — он будет иметь ме- сто и при очень больших выборках данных (числе учащих- ся). Просто это свойство слабой шкалы измерений. Ска- занное будет относиться и к любым другим критериям оценки, использующим шкалу порядка.
Шкалу балльных оценок так же, как и другие шкалы порядка, можно использовать в педагогических исследо-ваниях, если исследователь убежден в объективности вы-ставляемых оценок. Но в этом случае необходимо исполь-зовать специальные непараметрические критерии разли- чий, например критерий знаков (о статистических критериях достоверности различий мы поговорим немного ниже.) Но эти критерии слабые и для установления досто-верных различий необходимо получение значительно больших массивов данных.
По этим соображениям целесообразно использовать та-кие способы оценки, которые позволяют применить шкалу отношений или шкалу интервалов, а не шкалу порядка. Например, использовать тесты — серии коротко и точно сформулированных вопросов, заданий, на которые уча- щийся должен дать краткие и однозначные ответы, в пра-вильности (или неправильности) которых нельзя сомне- ваться. Точно так же могут быть построены письменные контрольные работы, результаты обработки анкет (про- цент учащихся, давших положительные ответы на тот или иной вопрос) и т.д.
Необходимо сделать еще одно предупреждение об использовании дихотомической шкалы (т.е. шкалы, имею- щей всего 2 значения: да — нет, 1—0 и т.д.), а также любых дискретных шкал с ограниченным числом градаций (три-хотомических и т.д.). Их можно успешно использовать для установления различий в результатах каких-либо педаго-гических воздействий в диагностических, констатирую- щих, «срезовых» целях. Но если исследуется динамика раз- вития какого-то педагогического процесса, например про-цесса становления у учащихся того или иного навыка, то такие шкалы в этом случае принципиально не годятся, так как они существенно искажают динамику процесса. К при-меру, на так называемых кривых обучения — графиках, показывающих изменение того или иного параметра в за-висимости от времени обучения, появляются своеобраз- ные ступени, «этапы», которых нет в действительности, при использовании шкалы отношений, выраженной в мерах физических величин (время и т.п.) см., например: [8]. По крайней мере, для изучения динамики развития каких- то педагогических процессов во времени необходимо ис-пользовать дискретные шкалы измерения с достаточно большим числом градаций.
Формирование критериев достоверности будущих ре-зультатов исследования завершается концептуальная ста- дия его проектирования. Следующая стадия проектирова- ния научного исследования — построение гипотезы.
Построение гипотезы исследования
Построение гипотез является одним из главных методов развития научного знания, который заключается в выдви-жении гипотезы и последующей ее экспериментальной, а подчас и теоретической проверке, которая либо подтвер- ждает гипотезу — и она становится фактом, концепцией, теорией, — либо опровергает, и тогда строится новая ги-потеза и т.д. Гипотеза, по сути дела, является моделью бу-дущего научного знания (возможного научного знания).
Научная гипотеза выступает в двоякой роли: либо как предположение о той или иной форме связи между наблю-даемыми явлениями и процессами, либо как предположе- ние о связи между наблюдаемыми явлениями, процессами и внутренней производящей их основой. Гипотезы первого рода называются описательными, а второго — объясни-тельными. В качестве научного предположения гипотеза отличается от произвольной догадки тем, что удовлетво- ряет ряду требований. Выполнение этих требований обра- зует условия состоятельности гипотезы.
Первое условие состоятельности гипотезы. Гипотеза должна объяснять весь круг явлений и процессов, для ана- лиза которого она выдвигается (то есть для всей предмет- ной области создаваемой теории), по возможности не вхо- дя в противоречия с ранее установленными фактами и на-учными положениями. Однако если объяснение данных явлений на основе непротиворечия известным фактам не удается, выдвигаются гипотезы, вступающие в противоре- чие с ранее доказанными положениями.
Второе условие: принципиальная проверяемость гипо-тезы. Гипотеза есть предположение о некоторой непосред-ственно ненаблюдаемой основе явлений и может быть про-верена лишь путем сопоставления выведенных из нее след-ствий с опытом. Недоступность следствий опытной проверке означает непроверяемость гипотезы.
Третье условие: приложимость гипотезы к возможно более широкому кругу явлений. Из гипотезы должны вы-водиться не только те явления и процессы, для объяснения которых она специально выдвигается, но и возможно более широкий класс явлений и процессов, непосредственно, ка-залось бы, не связанных с первоначальными.
Четвертое условие: наивозможная принципиальная простота гипотезы. Это не должно пониматься как требо- вание легкости, доступности или простоты. Действитель- ная простота гипотезы заключается в ее способности, исхо- дя из единого основания, объяснить, по возможности, более широкий круг различных явлений, процессов, не прибегая при этом к искусственным построениям и произвольным допущениям, не выдвигая в каждом новом случае все но- вых и новых гипотез.
Соблюдение этих четырех основных условий состоя-тельности гипотезы, естественно, еще не превращает ее в теорию, но при их отсутствии предположение вообще не может притязать на роль научной гипотезы.
Кроме этих основных условий научной состоятельности гипотезы, необходимо отметить еще ряд моментов. В част-ности, гипотеза должна формулироваться исключительно в строгих рамках той предметной области, в которой изу-чается поставленная исследователем проблема. В исследо-ваниях по педагогике, другим гуманитарным и обществен- ным наукам, а также по техническим, естественным наукам в построении гипотезы, а вслед за этим и всего исследова- ния, нередко происходит «сползание» со своей предметной области. В результате работа становится рыхлой, расплыв-чатой; исследователь подчас сам не представляет — чем же он занимается.