Смекни!
smekni.com

Предисловие редактора перевода (стр. 14 из 67)

Одной из теоретических моделей, основанных на анализе признаков, является система "Пандемониум" (Selfridge, 1959). Эта система представлена на рис. 4.3. Как и в нашей общей модели (рис. 4.1), здесь предполагается, что процесс распознавания образов состоит из нескольких этапов или уровней.

На каждом уровне имеется отряд "демонов", которые выполняют ту или иную работу, связанную с распознаванием предъявленного образа. На первом уровне действуют демоны изображения, которые заняты тем, что мы назвали сенсорной регистрацией, т. е. регистрируют стимул как некое событие на сенсорном уровне. Затем это событие анализируется демонами выделения признаков, которые разбивают первичное изображение на составляющие элементы. Каждый такой демон ищет в изображении лишь один признак — определенную прямую, расположенную под определенным углом, или кривую — и регистрирует его, если находит. За демонами выделения признаков следят демоны опознавания, соответствующие перечням признаков. Перечень, имеющийся у каждого из таких демонов, относится к одному определенному образу, и работа этого демона состоит в том, чтобы "кричать", или сигнализировать, тем громче, чем больше "своих" признаков он найдет среди тех, которые были выделены в результате анализа признаков. Наконец, на самом верхнем уровне восседает демон принятия решения (процесс принятия решения); он должен установить, какой из демонов опознавания кричит громче всех, и в результате распознать образ.

Не удивителько, если все эти рассуждения покажутся знакомыми, так как гипотеза признаков очень сходна с гипотезой эталонов. Ведь в сущности всякий признак является неким эталоном; только в данном случае эталон соответствует не стимулу в целом, а лишь некоторой его части. Преимущество гипотезы признаков состоит в том, что если можно выделить набор признаков, позволяющих описывать гораздо более широкий круг образов (например, описать речь при помощи нескольких элементарных признаков), то число эталонов, с которыми нужно иметь дело, резко сокращается. Однако сходство гипотезы признаков с гипотезой эталонов влечет за собой множество проблем, общих для них обеих.

Как, например, система, основанная на анализе признаков, будет справляться с вариациями в величине того или иного зрительного элемента? Как она будет распознавать новые признаки, никогда прежде не виденные? Что произойдет, если два стимула будут различаться только присутствием или отсутствием какого-либо элемента? Примером может служить нижняя горизонтальная линия, которая есть у буквы Е, но отсутствует у F. В этом случае в ДП могут найтись два перечня признаков, подходящих для опознания стимула F, так как все элементы буквы F соответствуют признакам, содержащимся в перечнях как для Е, так и для F. В случае распознавания элементов речи возникают еще большие сложности. Прежде всего далеко не всегда ясно, где именно начинается или кончается данная речевая единица, что сильно затрудняет разбиение образа на отдельные признаки. Послушайте речь на незнакомом языке: вам будет казаться, что человек говорит невероятно быстро, и почти невозможно будет решить, где кончается одно слово и начинается другое. Если мы внимательно прислушаемся к людям, говорящим по-английски, то мы обнаружим, что они нередко делают более длительные паузы в середине слова, чем между двумя словами.

Пока у нас нет возможности окончательно разрешить все эти проблемы, связанные с распознаванием образов. Это не значит, однако, что гипотезу, основанную на анализе признаков, следует отбросить. В конце концов все другие гипотезы также имеют свои недостатки. Кроме того, есть ряд экспериментальных результатов, говорящих о том, что при распознавании действительно используется метод сопоставления признаков.

Некоторые данные о роли анализа признаков в распознавании образов носят физиологический характер. Показано, например, что в зрительной системе имеются специализированные клетки, функции которых состоят в распознавании определенных признаков. За последние 10 -15 лет физиологи (Hubel a. Wiesel, 1962; Lettvin а. о., 1959) обнаружили в зрительной системе кошек, лягушек и других животных нервные клетки, реагирующие только на зрительные стимулы определенного типа. Это могут быть, например, горизонтальные, вертикальные или движущиеся линии. Установлено, что в мозгу ля.гушки некоторые клетки реагируют на появление в зрительном поле движущихся черных точек; было высказано предположение, что эти клетки представляют собой "детекторы мух": их реакция помогает лягушке добывать пищу! Существует явная аналогия между стимулами, приводящими в действие специализированные нейроны, и тем, что мы называем здесь признаками. Можно допустить, что у человека тоже есть клетки, которые разряжаются при появлении тех или иных элементов сенсорного материала и выполняют в зрительной системе роль анализаторов признаков. По-видимому, некоторые клетки реагируют независимо от таких специфических характеристик стимула, как длина. Они могли бы служить детекторами более абстрактных признаков (например, выявлять наличие линии любой длины, расположенной под определенным углом); возможно, это помогло бы понять, почему нам удается распознавать образы независимо от их величины и т. п.

Есть и другие данные, свидетельствующие о важной роли признаков в распознавании зрительных образов. Маленькие дети, например, часто путают буквы b и d. Возможно, что это результат их неспособности различать два элемента (например, с и э ), сходных во всем, кроме своей ориентации. У взрослых аналогичный эффект можно получить, предъявляя им зрительные стимулы с такой быстротой, при которой восприятие может оказаться неполным. В подобных экспериментах испытуемые делают ошибки такого же рода, как и в экспериментах с определением объема памяти. Когда, например, какая-нибудь буква предъявляется на очень короткое время, после чего испытуемого просят назвать ее, он часто называет вместо предъявленной буквы какую-нибудь другую. В отличие от ошибок, допускаемых при определении объема памяти, которые, по-видимому, вызываются сходством по слуховым признакам, ошибки в таких экспериментах обусловлены зрительным сходством (Kinney а. о., 1966). В них D гораздо чаще называют вместо Q, чем вместо В. Буквы Q и D имеют общие зрительные признаки, тогда как D и В сходны на слух, но очень несходны по виду. Характер таких ошибок позволяет думать, что зрительное восприятие букв основано на анализе признаков.

Из всего сказанного видно, что имеются данные как в пользу формирования прототипов, так и в пользу анализа признаков. Мы убедились также в том, что многое в распознавании образов поддается объяснению с помощью обеих гипотез, но в то же время многие проблемы (причем одни и те же) ни та ни другая гипотеза разрешить не может. Какая же из двух гипотез лучше? На данном этапе ответ на этот вопрос остается неясным. Возможно, что обе гипотезы в каких-то случаях верны, так как ввиду большого разнообразия распознаваемых нами стимулов механизмы их ра.епознавания могут быть разными. Кроме того, возможно, что различия между тем, что мы называем прототипами и признаками, не столь велики, как это кажется. Во-первых, .эти две концепции можно объединить: можно рассматривать лрототип как состоящий из признаков, общих для всех реа.лизаций данного образа; тем самым идея прототипов становится столь же совместимой с признаками, как она совместима с эталонами. Во-вторых, важно понять, что на некотором уровне гипотеза, основанная на анализе признаков, очень сходна с гипотезой эталонов. Одна из проблем, возникающих при формулировке гипотезы признаков, касается того, каким образом происходит распознавание отдельных признаков, например линий, образующих данный угол. Возможяо, что здесь придется постулировать процесс сравнения, сопоставляющий признак с внутренним эталоном. В результате получится эталонная теория распознавания признаков! Эти соображения иллюстрируют ряд трудностей, возникающих при попытке точно определить тип кодирования в ДП, используемый при распознавании образов. Хотя нам, может быть, и не удастся точно определить этот код, в наших рассуждениях о нем мы значительно продвинулись вперед по "сравнению с наивной гипотезой эталонов; при этом мы уяснили себе ряд важных моментов, касающихся процесса расаюзнавания.

ПРОЦЕССЫ, СВЯЗАННЫЕ С РАСПОЗНАВАНИЕМ

В распознавании образов есть один этап, который мы пока еще подробно не обсуждали ,- это процесс сравнения и принятия решения. Рассмотрим в связи с этим гипотезу эталонов. Каждый образ необходимо сравнивать с многочисленными эталонами, после чего можно выбрать тот эталон, который лучше всего соответствует данному стимулу. Понятно, что ввиду огромного количества хранящихся в памяти эталонов подобное сравнение было бы очень громоздкой и трудоёмкой процедурой. Пришлось бы перебирать многие тысячи эталонов, прежде чем удавалось бы принять решение. Как все это могло бы осуществляться? Если бы распознающий механизм должен был сравнивать входной стимул поочередно с каждым эталоном, то для узнавания некоторых стимулов требовалось бы очень много времени; те же самые соображения относятся к "прототипам" или "перечням признаков", если заменить ими "эталоны". А между тем мы знаем, что образы распознаются очень быстро.