Смекни!
smekni.com

Некоторые проблемы формализации гуманитарных знаний (на примере археологии) (стр. 2 из 2)

Связанность ограничений на обработку данных с типом измерительной шкалы заставляет обратить внимание еще на одно широко (к сожалению) распространенное заблуждение о безоговорочной допустимости оцифровки качественных признаков. Увы, авторы книги разделяют это заблуждение(см. § 7.3.2. на стр. 105). Метод оцифровки сводится к "разумному" присвоению числовых меток категориям качественных признаков и их последующей обработке как чисел. Такой подход игнорирует проблему допустимых операций и может приводить к неверной интерпретации результатов.

Причин, по которым оцифровка многим кажется безобидной операцией, предоставляющей удобства при анализе данных, две. Во-первых, в некоторых алгоритмах анализа могут отсутствовать недопустимые операции, и тогда оцифровка действительно безопасна. Во-вторых, иногда слабые шкалы являются не настоящими качественными, а огрубленными количественными. При этом "испорченное" количество все-таки несет в себе количественное начало, для которого арифметические преобразования имеют какой-то смысл. И все же для номинальных и многих ранговых данных оцифровка в принципе недопустима. Тем более, что существуют алгоритмы совместного анализа разнотипных данных, т.е. измерений, принадлежащих различным шкалам.

Об использовании статистических методов

Книга заслуженное внимание уделяет пропаганде применения в археологии различных статистических методов (§ 2.2.2) и иллюстрирует их полезность на многих примерах (гл. VIII). Однако пропаганда статистики должна также сопровождаться предупреждениями о трудностях, ловушках и возможных неправильностях в использовании статистических методов. Пренебрежение ими дает основания для мрачно-юмористических высказываний типа "Есть три вида лжи - просто ложь, наглая ложь и статистика". Оставив в стороне человеческий фактор (например, недобросовестный или субъективный отбор данных), можно выделить несколько правил "статистической техники безопасности", связанных с самой природой статистических выводов.

Данные должны иметь действительно случайную природу (обладать статистической устойчивостью), что далеко не всегда имеет место, и очень непросто проверяемо.

Закономерность, выявленная статистически, никогда не бывает абсолютно точной: числовая характеристика всегда оценивается лишь приближенно; вероятность ошибки статистического вывода всегда отлична от нуля (ошибки первого и второго родов).

В структуре любого алгоритма статистической обработки данных заложены априорные предположения о природе данных. Если эти предположения расходятся с тем, что есть на самом деле, выводы получаются совсем не такого качества, которое от них ожидается. Практики же редко проверяют выполнимость "паспортных" ограничений на применимость процедур.

Выявленная статистическая закономерность подлежит содержательной интерпретации. Статистику нельзя обвинять за то, что вполне надежный статистический вывод неверно проинтерпретирован специалистом - пользователем; последний же часто "пеняет на зеркало".

В силу указанных причин очень верным является совет авторов археологам повышать свою квалификацию в области статистики (стр. 25), хотелось бы добавить к этому рекомендацию в сложных случаях почаще привлекать к сотрудничеству профессиональных статистиков. Например, для меня осталось загадкой, почему авторы проигнорировали (см. стр. 123 и гл. VII) результаты своих соседей из Института математики СО РАН профессоров Загоруйко и Лбова, которых они, очевидно, лично знают.

Заключение

Оценка монографии "Математические методы в археологических реконструкциях" (Новосибирск, 1995) археологами и историками - дело специалистов в этой области. Может быть, их заинтересуют и впечатления специалиста совсем из другой области - анализа данных, - изложенные в данной статье. Еще раз подчеркну: хотя здесь я изложил комментарии критического порядка, в целом обсуждаемая книга является несомненным шагом вперед в прогрессе археологии. Адекватное использование математики и компьютерных технологий есть явный признак повышения информационной зрелости любой науки, и за археологию можно порадоваться.