Смекни!
smekni.com

Когнитивная наука Основы психологии познания том 1 Величковский Б М (стр. 57 из 120)


Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ори­ентации, а затем в нормальном и снова в перевернутом положении

Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спе­цификой деталей. В отличие от восприятия обычных предметов и объек­тов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей сте­пени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изме­нение диаметра зрачка обычно не воспринимается как таковое, а интер­претируется глобально, скажем, как увеличение привлекательности. Це­лостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображе­ния на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.

Зависимость восприятия «внутренней геометрии» лица от его ори­ентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215


можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не ме­нее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозго­вого картирования, эти формы восприятия, по-видимому, преимуще­ственно связаны с нижневисочными отделами правого полушария.

В нижневисочных отделах коры тоже локализуются процессы, су­щественные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы вос­приятия формы объектов и как это связано с межполушарными разли­чиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные меха­низмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработ­ке формы и узнавании повседневных предметов Однако они не вовле­чены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это пред­варительное объяснение подтверждается, в частности, анализом основ­ных синдромов дислексии — нарушения чтения при локальных пора­жениях мозга (см 7 2 2)

3.3.2 Влияние нейронаук и информатики

Многие из числа известных современных теорий распознавания опира­ются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизи­ологии, нейропсихологии и нейроинформатики. Начало переориента­ции психологических описаний восприятия на физиологическую тер­минологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую изве­стность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды амери­канская исследовательница восприятия Науми Уайсстейн)

Эти данные, полученные при изучении зрительной системы кура-

ризированных кошек, были использованы в дальнейшем для моделиро-

216 вания различных аспектов зрительного восприятия. Если нейроны вы-


деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Мате­матическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отне­сением участков, ограниченных контурами, к одним и тем же или к раз­ным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некото­рое сочетание детекции пространственных частот и ориентации Участ­ки гладких поверхностей moi ут моделироваться путем выделения оваль­ных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).

На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ






Рис. 3.15. Гладкие изменения телесных поверхностей (А) можно аппроксимировать (Б) с помощью множества овальных участков, разной ориентации (по Koendennk & van Doom, 2003)


217


218


по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вы­числительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной инфор­мации. На первом этапе вычисляется грубое, но полное описание изме­нений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения ярко­сти: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных пара­метрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, по­скольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок карти­ны. По отношению к первичному наброску последовательно применя­ются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона.

Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в рабо­тах Марра значительно менее подробно, чем первичная сенсорная обра­ботка. Первоначально строится так называемая «двух-с-половиной-мер-ная» (2'/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом воспри­ятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, уни­версальными элементами «ментального конструктора» служат обобщен­ные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответству­ет микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческо­го тела, показанная на рис. 3.16. Незначительная модификация парамет­ров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).

К этой же группе моделей примыкает теория американского психо­лога Ирвина Бидермана (Biederman, 1987), предположившего, что зри­тельная система располагает целым алфавитом таких базовых элементов, которые он называет геонами. Наряду с цилиндрами, этот алфавит вклю­чает еще несколько других простых форм, таких как конусы и паралле­лепипеды. Различные предметы могут составляться из разных элемен­тов. Психофизиологическая реальность подобных элементов не вполне очевидна. Эксперименты с использованием так называемого прайминга (см. 5.1.3), при которых гипотетические элементы предмета предъявля­лись в некотором иррелевантном контексте непосредственно перед опы­тами на его прямое опознание, не выявили в общем случае ожидавшего­ся ускорения опознания. Поэтому вопрос о возможности некоторой