Смекни!
smekni.com

Предисловие редактора перевода (стр. 12 из 67)

Упрощенная схема распознавания образов представлена на рис. 4.1. Можно видеть, что этот процесс слагается из нескольких этапов. Прежде всего подлежащий распознаванию стимул поступает, в сенсорный регистр. Поскольку след сохраняется здесь очень недолго, процесс распознавания должен быстро завершиться, пока в регистре еще есть информация о стимуле. Сам процесс распознавания заключается в сопоставлении входного стимула с закодированной информацией, находящейся в ДП, а это означает, что информация в ДП должна быть представлена в такой форме, чтобы стимул можно было с ней сравнивать. Иначе говоря, хранящееся в ДП закодированное представление о стимуле должно быть в некотором смысле похожим на этот стимул или как-то описывать его внешний вид или форму. После сравнения входного стимула с содержащимися в ДП кодами принимается решение о том, какой из этих внутренних кодов наилучшим образом соответствует данному стимулу. От этого решения зависит выходной сигнал распознающей системы — сообщение о результате принятого решенияонечно, после того как образ распознан, из ДП может быть извлечена дополнительная информация о нем. Например, распознав в предъявленном стимуле букву А, мы можем затем припоминать все, что нам о ней известно: это первая буква алфавита; с этой буквы начинается слово "арбуз"; это обозначение футбольных команд высшего класса и так далее.

Итак, мы видим, что процесс распознавания образов состоит из нескольких сложных субпроцессов. Это прежде всего сенсорная регистрация, рассмотренная в предыдущей главе. Затем идут процессы сравнения и принятия решения. Здесь возникают вопросы, связанные с представлением информации. В какой форме закодирована та хранящаяся в ДП информация, с которой сравнивается входной стимул? Насколько закодированный стимул сходен с первоначальным? В остальных разделах этой главы мы рассмотрим кодй памяти и некоторые процессы сравнения и принятия решения, которые можно постулировать для системы распознавания образов.

КОДЫ ПАМЯТИ И РАСПОЗНАВАНИЕ

ЭТАЛОНЫ

Мы начнем рассмотрение кодов памяти с тех кодов ДП, которые используются при сопоставлении прошлого опыта с вновь поступающими стимулами. Что это за коды? Код должен либо соответствовать данному стимулу, либо описывать его, иначе он не сможет быть образцом для сравнения. Одна из возможных гипотез состоит в том, что хранящийся в ДП код представляет собой миниатюрную копию (или "эталон") данного стимула; для каждого распознаваемого нами стимула в ДП имеется его внутренний дубликат, который и используется при распознавании. Согласно этой гипотезе, для распознавания образа приходится сравнивать данный стимул с длинным рядом эталонов, хранящихся в ДП. Распознание совершится в тот момент, когда будет выбран наиболее подходящий для данного стимула, эталон и тем самым определится, что же представляет собой этот стимул.

Однако гипотеза эталонов слишком проста; она чересчур наивна, чтобы служить основой для теории распознавания образов. Ее главный недостаток-огромное количество необходимых эталонов. Рассмотрим, например, распознавание одного не очень сложного стимула — буквы А. Согласно гипотезе эталонов, в ДП имеется копия этой буквы, с которой сравнивается любой стимул, похожий на А, когда бы он ни появился, и которая соответствует ему лучше, чем любой другой эталон. Отсюда, однако, следует, что нам понадобится отдельный эталон для каждой разновидности буквы А. Изменилась величина стимула? Нужен другой эталон. Если слегка повернуть букву, нужен будет еще один эталон. Для какого-нибудь своеобразного начертания, например

, опять-таки потребуется свой особый эталон. Если у нас не будет эталонов для всех этих разновидностей буквы А, то при распознавании неизбежно возникнут ошибки. Например, может оказаться, что наклонное А лучше соответствует эталону для R, чем для А, и тогда, встретившись с А, мы распознаем его как R. Чтобы исключить возможность таких ошибок, понадобится бесчисленное множество эталонов, несомненно гораздо большее, чем может вместить ДП.

Гипотезу эталонов можно видоизменить, сделав ее гораздо более приемлемой. Одна модификация состоит в том, чтобы добавить к модели процесс, который предшествует сопоставлению и служит для "очистки" входного стимула. Такая предварительная обработка могла бы придавать стимулу стандартное положение и стандартные размеры. Этот процесс называют "нормализацией", так как он устраняет различные неправильности в форме стимула и приводит его к более обычному виду. Например, если стимул имел вид

, то в результате нормализации он уменьшился бы, искривленная правая часть была бы выпрямлена, и все это произошло бы еще до сравнения стимула с эталоном. Подобный процесс сильно сократил бы число эталонов, необходимых для распознавания буквы А.

Однако нормализация, предшествующая сравнению, не позволяет снять все трудности, связанные с эталонной гипотезой. Логически возникает следующее возражение: для того чтобы знать правильную ориентацию и величину стимула, нужно заранее знать, какой образ представляет данный стимул. Например, какую ориентацию должен иметь стимул, имеющий вид наклоненного Q? В одном случае он будет выглядеть как Р, а в другом как Q. Чтобы знать, какой из этих двух поворотов будет правильным, необходимо сначала решить, какая это буква. Но эта задача возлагается именно на систему распознавания, а не на предшествующий ей преобразователь. С этой логической проблемой, однако, нетруд но справиться. Во-первых, при резких отклонениях стимула от стандартной ориентации он, по всей вероятности, окажется: нераспознаваемым. Иными словами, нет нужды постулировать, что этот предварительный процесс сможет переработать сильно наклоненную букву Q, если в действительности распознающая система не способна иметь дело с такого рода стимулами. Во-вторых, подлежащие распознаванию стимулы обычно включены в какой-то более обширный контекст, и этот контекст может помогать процессу нормализации, подсказывая, как нужно изменить положение или величину данного стимула.

В более общем плане контекст сильно помогает процессу распознавания, сокращая число образов, которым мог бы соответствовать данный стимул. Кроме того, контекст облегчает решение таких проблем, как распознавание совершенно новых стимулов. Как нам удается распознать такой стимул, как

, если мы его никогда раньше не видели? Совершенно очевидно, что в ДП не может быть соответствующих эталонов. В каком качестве будет распознан подобный стимул, зависит от того, когда и где мы с ним встретимся. Если он появится при обсуждении распознавания букв алфавита, то он, возможно, будет воспринят как буква А, если же мы встретим его в такой карикатуре:

то вряд ли он нам покажется похожим на А.

ПРОТОТИПЫ

Контекст может помочь нам справиться с некоторыми трудностями, присущими гипотезе эталонов, но он не позволяет решить проблему полностью. Дело в том, что многие стимулы, которые мы умеем распознавать, предстают перед нами вне специального контекста, и тем не менее мы распознаём их, несмотря на различия в размерах и ориентации.

В связи с этим нужно, по-видимому, иметь такую эталонную систему, которая допускает некоторые вариации или "расплывчатость" входящих в нее образов. Иными словами, распознающее устройство должно хорошо работать и при наличии мелких вариаций, которые могут оставаться после "очистки" стимула. После введения в распознающее устройство эталонов, допускающих вариации, система становится более сходной с так называемой системой прототипов, или системой, основанной на схемах.

Схема-это просто набор правил для создания или описания прототипа, под которым мы здесь имеем в виду некую .абстрактную фигуру, отображающую основные элементы какого-то множества стимулов. Например, прототип самолета можно представлять себе в виде длинной трубы, к которой прикреплены два крыла; все самолеты окажутся различными вариантами этого прототипа. Иными словами, прототип-это некая сущносгь, некая главная или средняя тенденция, даже если хотите, платонова "идея". Согласно прототипной гипотезе распознавания образов, в ДП хранятся прототипы обобщенные, идеализированные образцы известного множества стимулов. Теоретически любой стимул можно закодировать в виде Трототипа в сочетании с перечнем вариаций, после чего все поступающие стимулы можно сопоставлять с прототипами, а не с эталонами. (Таким образом, концепция эталонов заменяется здесь концепцией прототипов). Предполагается, что наша долговременная память содержит прототипы всех распознаваемых нами категорий-собак, человеческих лиц, букв А и т. д.,- что и позволяет нам узнавать отдельных представителей этих категорий.

Существуют ли прототипы на самом деле? Судя по некоторым экспериментальным данным, на этот вопрос можно ответить утвердительно: известны случаи формирования прототипов для множеств стимулов. Например, Познер и Кил (Posner a. Keele, 1968) провели эксперимент, в котором испытуемые вели себя так, как если бы у них вырабатывались прототипы. Прежде всего Познер и Кил построили прототипические образы, состоявшие из 9 точек каждый. В некоторых случаях эти точки располагались в виде геометрической фигуры, например треугольника, в других-в виде буквы, в третьих-случайным образом. Затем, несколько сдвигая некоторые точки, экспериментаторы создавали новые фигуры-искаженные формы тех же прототипов (рис. 4.2, А). Иногда точки сдвигались в одном направлении, иногда — в другом, так что исходный прототип соответствовал фигуре, которая бы получилась, если бы мы поместили каждую точку в среднее положение по отношению ко всем отклонениям. Создав прототипы и по нескольку искажений каждого из них, Познер и Кил приступили к экспериментам на нескольких группах испытуемых. Рассмотрим пример, когда прототипы представляли собой случайные группировки точек; отклонения от прототипов при этом тоже, конечно, были случайными наборами. Испытуемым показывали сначала (одно за другим) четыре отклонения от каждого из трех случайных прототипов. Им предлагалось классифицировать каждое отклонение, т. е. указать, к какой из трех категорий оно принадлежит. Все отклонения, соответствующие одному прототипу, следовало относить к одной и той же категории, однако испытуемым не показывали ни один из прототипов. В конце концов испытуемые научились правильно классифицировать фигуры, т. е. относить все отклонения от одного прототипа в одну категорию, все отклонения от другого — в другую и т. д. Затем испытуемым дали новую задачу на классификацию. Им предъявили ряд фигур и попросили отнести каждую из них к одной из установленных ранее трех категорий. Некоторые из этих фигур испытуемые уже видели прежде (известные отклонения), другие представляли собой новые искажения того же прототипа, а третьи были сами прототипы, которых испытуемые раньше не видели. Известные отклонения, как и следовало ожидать, классифицировались довольно удачно-частота правильных ответов составляла 87%. Неожиданным оказалось то, что примерно так же хорошо классифицировались прототипы, хотя испытуемые никогда их прежде не видели. Однако новые отклонения, которые испытуемые увидели впервые, классифицировались менее точно-частота правильных ответов составляла здесь уже только 75%. Ввиду высокой точности классификации прототипов авторы высказали мнение, что испытуемые, обучаясь классифицировать первую группу отклонений, на самом деле усвоили и прототипы. Иными словами, испытуемые абстрагировали некую среднюю тенденцию — представление о прототипе-из ряда стимулов, которые были вариациями этого прототипа.