Смекни!
smekni.com

Когнитивная наука Основы психологии познания том 2 Величковский Б М (стр. 26 из 118)

Исторически первой теорией, предназначенной для объяснения ус­тойчивого восприятия речи в условиях неустойчивости акустических признаков фонем, была моторная теория восприятия (Lieberman & Blumstein, 1988). Сторонники этой теории пытались объяснить инвари­антное восприятие меняющихся в зависимости от контекста фонем встречной артикуляцией соответствующих сегментов речи по ходу их восприятия. Действительно, при осложнении условий восприятия мы часто повторяем услышанное, но, возможно, это лишь проявление об­щей стратегии перепроверки полученной в процессе нарушенного обще­ния информации, а не специализированный моторный механизм, встро­енный в само восприятие. У моторной теории мало доказательств «за» и много аргументов «против». В частности, против предположения о су­щественной роли артикуляции говорят данные о возможности нормаль­ного восприятия в случае паралича речевой мускулатуры и при затруд­нениях артикуляции. Об этом же говорит анализ синхронного перевода. Последний действительно может быть практически «синхронным», то есть настолько близким к одновременному прослушиванию языка-ис­точника и произнесению слов в целевом языке, что ни о какой проме-

2 С нейрофизиологической точки зрения, этот эффект достаточно неожиданен, так как
кортикальные вызванные потенциалы на акустические события всегда примерно на 40 мс
опережают зрительные. Иными словами, чтобы добиться одновременной регистрации
зрительных и слуховых событий кортикальными механизмами сенсорной обработки слу­
шателя, говорящего нужно было бы отодвинуть на расстояние, примерно равное 10 м.

3 О. критической роли слогов в восприятии речи мог бы говорить тот факт, что дли­
тельность типичного слога, примерно равная 250 мс, совпадает со средней оценкой
продолжительности сохранения акустической информации в слуховом сенсорном ре­
гистре — эхоической памяти (см. 3.2.2). Типичный слог представляет собой движение от
закрытого положения рта к открытому (гласному звуку) и вновь к относительно закрыто­
му, соответствующему либо конечной согласной данного слога, либо первой согласной
следующего. Существует предположение, что в основе слоговой организации устной речи

98 может лежать древняя синергия жевательных движений.


1


жуточной артикуляции слов языка-источника, якобы необходимой для его восприятия, не может быть и речи.

Психолингвист из английского Кэмбриджа Уильям Марслен-Уилсон (например, Marslen-Wilson, 1990) разработал когортную модель восприя­тия слов, согласно которой детальный фонологический анализ вообще не имеет места. На основании когнитивных ожиданий, генерируемых из контекста, и общего анализа первых звуков слова активируется предва­рительный список слов-кандидатов, называемый когортой. Любая после­дующая информация, как акустическая, так и семантико-синтаксическая, используется для удаления из когорты неподходящих слов. Обработка прерывается при удалении всех кандидатов, кроме одного. Достижение «точки узнавания», таким образом, является результатом параллельной обработки информации на нескольких уровнях. Под влиянием экспери­ментальных данных в последних версиях когортной модели предположе­ние о полной параллельности обработки было изменено: влияние семан­тического и синтаксического контекста сильнее сказывается в них на относительно поздних стадиях восприятия слова. Предсказания этой те­ории, в целом достаточно успешные, в настоящее время продолжают , проверяться. Конкуренцию ей составляют только коннекционистские модели.

Как мы отмечали выше (см. 2.3.3), коннекционистские модели вос­ходят к ранним моделям распознавания конфигураций, перцептронам. Эти модели допускают возможность любых коммутаций источников све­дений, тем самым объясняя также интермодальные эффекты в восприя­тии речи. С помощью относительно простых алгоритмов обучения они способны усваивать нерегулярные, чисто ассоциативные переходы, для которых нет соответствующих правил, например, «man—>men» или «go->went». Помимо этого, они способны аппроксимировать то, что описывается в генеративной грамматике как примеры применения аб­страктных правил, например, постепенно моделировать — при воспри­ятии и порождении — регулярные синтаксические эффекты, типа выяв­ления множественного числа английских существительных на основе окончания «s» или прошедшего времени глаголов по «ed». Данные о раз­витии речи и о статистическом соотношении регулярных и нерегуляр­ных эффектов в отдельных языках оставляют пока открытым вопрос воз- ' можной коннекционистской природы синтаксической компетентности в целом, свидетельствуя скорее о различиях в механизмах обработки регулярных и нерегулярных грамматических переходов (Pinker, 2000)4.

В современных лингвистике и психолингвистике часто используют­ся гибридные архитектуры, когда, например, нейросетевые компоненты вводятся в качестве адаптивного модуля в модели символического типа. Это позволяет обеспечить настройку на индивидуальные характеристи­ки голоса или (в моделях чтения) на особенности движений глаз пользо­вателя. Смешанную архитектуру предполагает теория оптимальности

4 Например, при образовании множественного числа существительных в немецком
языке более частотными оказываются нерегулярные переходы и, естественно, возникает
вопрос, как нейронная сеть может путем чисто ассоциативного обучения выделить соот­
ветствующее правило, если ей чаще приходиться сталкиваться с отклонениями от него. 99

100


наиболее влиятельная на сегодняшний день модель восприятия и по­рождения фонологических аспектов речи (Prince & Smolensky, 1997; Smolensky, 2005). Она относится к классу влиятельных моделей удовлет­ворения множественных ограничений, позволяющих описывать нахожде­ние решения, которое оптимальным образом удовлетворяет нескольким различным правилам, таким как правила чередования согласных и глас­ных звуков, а также варьирования тона в тональных языках (таких как китайский). Коннекционистские модели также находят применение в задачах распознавания слов из заранее фиксированного и относительно небольшого набора команд. В этом качестве они начинают использо­ваться при речевом взаимодействии с различными техническими уст­ройствами. Некоторые из подобных прикладных разработок будут рас­смотрены нами в конце данной главы (см. 7.4.3).

Огромный интерес представляет восприятие глобальных акусти­ческих признаков, характеризующих сегменты речи, более крупные, чем отдельные фонемы, слоги и слова. Так, повышение тона голоса к концу фразы обычно означает вопрос, то есть то, что говорящий с вы­сокой степенью вероятности хочет что-то от вас услышать (хотя вопрос вполне может быть и риторическим, не предполагающим ответа — см. 7.1.2 и 7.4.1). Подобные интонационные, или просодические, признаки оказываются более инвариантными, чем акустические признаки от­дельных фонем, как с точки зрения возможного влияния актуального речевого контекста, так и в отношении межъязыковых различий.

К сожалению, эти аспекты восприятия речи стали интенсивно изу­чаться лишь сравнительно недавно (Кодзасов, 2004). В одном из иссле­дований (Ishii, Reyes & Kitayama, 2003) было проверено и получило экс­периментальное подтверждение давнее предположение, что в восточных культурах (в данной работе, в Японии и на Филиппинах) именно инто­нация, а не содержание речи, как это характерно для Европы или Север­ной Америки, спонтанно привлекает внимание слушателя. Смена языка, а именно переход испытуемыми-билингвами на английский язык, ниче­го не меняла в этой базовой направленности внимания. Итак, оказав­шись в Японии или Китае и получив в ответ на прямой вопрос, казалось бы, положительный ответ «да», нам следует очень внимательно отсле­дить тональность голоса собеседника! Имеющиеся нейропсихологичес -кие данные говорят о том, что подобные формы восприятия, равно как и процессы восприятия эмоциональных характеристик речи, преимуще­ственно вовлекают правое полушарие мозга, а следовательно, заведомо не классические речевые зоны Брока и Вернике, локализованные в ле­вом полушарии.


Л


7.1.2 Развитие языка и речевых действий

В настоящее время в литературе по когнитивным исследованиям пред­ставлены, как минимум, четыре основные точки зрения на возникнове­ние и природу развития языковых способностей. Первая и наиболее влиятельная из них представлена работами Хомского и Фодора и, по сути дела, для начала отрицает сам факт развития речи (см. 1.3.3 и 2.3.2). Для этих авторов и их многочисленных последователей в лингвистике и за ее пределами языковая компетентность, как некоторый внутренний потенциал обработки символической информации, является врожден­ной и неизменной способностью. По признанию самого Хомского, им предложена «модель мгновенного усвоения языка», а Фодор полагает, что психология преувеличивает роль когнитивного развития. Разверну­тый во времени процесс возникновения речи при этом не обсуждается, лишь иногда говорится о возможно имевшей место в филогенезе мгно­венной супермутации, или, как шутят критики этой концепции, «мута­ции волшебной пули».

Если отставить шутки в сторону, то следует признать, что в пользу этой точки зрения говорит внушительный список фактов: