Рис. 3.21. Осмысленный зрительный контекст сокращает количество сенсорной информации, необходимой для узнавания объекта. Глаз при изолированном предъявлении (А), в контексте частей лица (Б), в контексте лица (В) и в контексте человеческого тела (Г).
ры, легко преодолевающие возможное влияние таких переменных, как ожидание31.
Обратимся еще раз к приведенной только что цитате Шекспира. Не случайно речь идет о восприятии в ночных условиях, когда нарушено фокальное зрение, ответственное за восприятие деталей и идентификацию предметов (об этом говорит и характерный для сумерек или тумана амбьентный режим движений глаз, при котором возрастает амплитуда саккад, а длительность фиксаций уменьшается, причем несмотря на резкое увеличение перцептивной нагрузки — см. 3.4.2). Устранение возможности для фокального анализа увеличивает влияние внутренней, «эндогенной» составляющей — но, главным образом, в отношении дополнения отсутствующей физически детальной информации. Следующий пример иллюстрирует этот принцип дополнительности сенсорной информации и семантического знания. На рис. 3.21А обилие деталей позволяет легко узнать глаз. По мере добавления осмысленного контекста (рис. 3.21 Б и В) для этого оказывается необходимым все меньше деталей, пока всякое графическое «упоминание» глаза вообще не становится излишним (рис. 3.21Г). Количество сенсорных данных,
231
необходимое для узнавания какого-либо объекта, уменьшается при увеличении семантических сведений32.
«Общий смысл» ситуации влияет на решение многих других перцептивных задач, если они имеют выраженную «эндогенную» (причем не только когнитивную, но и эмоциональную — см. 9.4.3) составляющую, как это происходит в случае целенаправленного зрительного поиска и обнаружения. Так, Ирвин Бидерман и его сотрудники (Biederman, Glass & Stacy, 1973) показали в начале 1970-х годов, что нахождение целевого предмета в сложной предметной сцене резко затрудняется при нарушении ее общей простанственно-смысловой организации, даже если локальное окружение, положение и ориентация самого предмета при этом остаются неизменными (см. также 5.1.1 и 7.2.1).
Особенно выраженным влияние семантики оказывается в случае исследований так называемой «слепоты к изменению» {change blindness). Эти исследования (они будут подробнее рассмотрены в следующей главе — см. 4.4.1) выявили нашу нечувствительность к изменениям предметов и других визуальных особенностей наблюдаемой сцены, когда эти изменения совпадают по времени с глобальными прерываниями восприятия — как искусственными (отключение изображения на 50— 200 мс), так и естественными (саккады и моргания). В результате мы можем долго внимательно смотреть на предъявляющуюся вновь и вновь фотографию, допустим, набережной Сены, не замечая, что с каждым показом Собор Парижской Богоматери оказывается то в левой, то в правой части изображения.
Подобные данные, однако, большей частью получены в условиях, когда критические изменения были иррелевантны с точки зрения опыта деятельности наблюдателей. Кроме того, разные варианты изображений (и даже реальных событий — см. 4.4.1) не меняли общего смысла ситуации. В самое последнее время выполнено несколько работ, в которых анализировалась способность испытуемых видеть семантически релевантные изменения и подмены предметов в ситуациях игры в шахматы, наблюдения за футбольным матчем и поездкой на автомобиле по городу. Хотя эти изменения, как и раньше, вводились в моменты глобального прерывания восприятия, успешность их обнаружения увеличивалась в 3—4 раза, приближаясь к 100% (Velichkovsky et al., 2002a).
Интерпретация этих данных возможна прежде всего в рамках теоретических представлений, которые подчеркивают межуровневые взаи-
32 В истории живописи всегда использовалась эта особенность восприятия, позволяющая обходиться без точной прорисовки деталей. Начиная с работ импрессионистов, передача общего впечатления (фр. impression), основанная на игнорировании деталей, стала одним из основных художественных приемов. Аналогично, в современных фильмах, когда надо показать, скажем, множество охваченных паникой людей на палубе тонущего океанского лайнера, вместо актеров-статистов используются виртуальные персонажи, в об-232 лике которых отсутствуют многие важные при других обстоятельствах части лица и тела.модействия процессов актуального восприятия физических характеристик объектов и структур схематического, концептуального знания о мире (см. 6.3.1 и 6.4.2). Подобные взаимодействия, очевидно, имеют двусторонний характер — в отношении порядка вовлечения уровневых механизмов они могут протекать как по направлению «снизу вверх», так и по направлению «сверху вниз», причем зачастую это может происходить в одно и то же время, так что перцептивная интерпретация оказывается результатом параллельно-последовательной конвергенции, основанной на учете ограничений и возможностей нескольких различных уровней организации. Исследования последних лет свидетельствуют о том, что одним из важнейших признаков, позволяющих дифференцировать уровневые механизмы восприятия, является их избирательное взаимодействие с сенсомоторными процессами.
3.4. Восприятие и действие
3.4.1 Сенсомоторные основы восприятия (и наоборот)
Хотя уже в исходном варианте компьютерной метафоры познавательные процессы трактовались как активное преобразование информации, сенсорным системам оставлялась роль пассивного интерфейса — своего рода проекционного экрана, сохраняющего в течение долей секунды картинку физического воздействия. Благодаря теоретическим работам Гибсона и Найссера, а также первым масштабным исследованиям целенаправленной глазодвигательной активности, проведенным в 1960-е годы советским биофизиком А.Л. Ярбусом (см. 2.4.2), фокус действенной трактовки сдвинулся в область восприятия. Этот сдвиг был вызван и техническими проблемами, возникшими в когнитивной роботике. Доминирующим направлением здесь постепенно стало создание систем активного зрения, связанных с постоянным выбором фрагментов окружения для более углубленной обработки. Как оказалось, обработка по принципу «широко и глубоко» требует слишком большого количества вычислительных ресурсов и протекает недопустимо медленно (см. 9.2.3).
Обследование окружения и выбор объектов для детальной обработки осуществляется с помощью движений головы и тела, на которые накладывается тонкий узор движений глаз. Классификация видов движений глаз дана в таблице 3.2. Наиболее известной их разновидностью являются неоднократно упоминавшиеся выше саккады — чрезвычайно быстрые скачки баллистического типа, меняющие положение глаз в орбите и позволяющие выделять фрагменты сцены для последующей фиксации. Если фиксируемый объект движется, то глаза начинают отслеживать его в режиме динамической фиксации с помощью гладких, следящих движений. Если при этом меняется еще и расстояние между объектом и 233
Таблица 3.2. Разновидности движений глаз человека и приматов (по: Joos, Rutting & Veiichkovsky, 2003)
234
Название | Стимул | Результат | Скорость |
Поисковые (частично произвольные) движения | |||
Саккады | Изменения в периферии поля зрения или намерение | Обследование окружения, ориентировка на новые пели, зрительный поиск | Скорость до 800°/с, сред, частота 3—4 Гц, амплитуда до 60° |
Вергентные движения | Бинокулярная диспаратность или намерение | Бинокулярная фиксация объектов переменной удаленности от наблюдателя | Скорость до 10°/с |
Стабилизирующие (непроизвольные) движения | |||
Следящие движения (smooth pursuit) | Медленно движущийся объект | Отслеживание движений объекта | Скорость до 80°/с, затем сменяется саккадой |
Вестибулярный нистагм | Движения головы | Удержание линии взора в пространстве во время собственных движений | Подобно движениям головы, возвратный скачок до 500°/с |
Оптокинетический нистагм | Движение заполняющих поле зрения объектов | Удержание относительно неподвижного изображения объектов на сетчатке | Медленная фаза до 80°/с, возвратный скачокдо 5007с |
Микродвижения (непроизвольные движения во время фиксации) | |||
Дрейф | Тонические моторные и вестибулярные факторы | «Плавание» глаза во время фиксации, дезадаптация рецепторов | Скорость до 1-2УС, амплитуда до 15' |
M и кросаккады | Часто — вызванный дрейфом «уход» глаза с цели | Часто — восстановление фовеальной фиксации. Дезадаптация рецепторов | Скорость до 30°/с, амплитуда до 15' |
Тремор | Неконтролируемая неточность работы мотонейронов | Дестабилизация изображения на сетчатке и дезадаптация рецепторов | Частота до 100 Гц, амплитуда < Г |
наблюдателем, то в небольшом диапазоне удаленностей (примерно до 3 м) к отслеживанию подключаются так называемые вергентные движения, более известные как конвергенция и дивергенция. Когда наблюдатель сам перемещается в пространстве, относительная неподвижность проекции окружения на сетчатку поддерживается с помощью нистагма: пилообразных движений, медленная фаза которых компенсирует собственное движение, а быстрая — возвращает глаза в исходное положение. Для полноты картины отметим, что наши глаза во время фиксации не остаются неподвижными, а совершают мельчайшие микродвижения нистагмоидного типа, параметры которых также описаны в таблице.