Смекни!
smekni.com

Когнитивная наука Основы психологии познания том 2 Величковский Б М (стр. 47 из 118)

Практическое применение (защищенное несколькими патентами) находят работы по латентному семантическому анализу (см. 6.1.1 и 7.4.2). Он используется, например, для определения индивидуального профиля интересов покупателей интернет-магазинов. Каждый выбор книги в интернет-магазине фирмы AMAZON сопровождается опреде­лением семантического вектора интересов, к которому автоматически подбираются наиболее похожие книги, сразу же предлагаемые для по­купки (обычно в пакете двух-трех наименований). Последующее взаи­модействие позволяет еще более точно определить профиль интересов данного клиента. Понятно, что эта же когнитивная технология может использоваться и в целом ряде других практически важных ситуаций — подборе работы по интересам и квалификации клиента, нахождении сходных по содержанию текстов при полном различии составляющих эти тексты слов и, например, при автоматической оценке качества пе­ревода текстов с одного языка на другой.


Фундаментальная проблема состоит в поддержке коммуникации, которая включена в процессы решения некоторых конкретных опосре­дованных использованием компьютеров практических задач (CSCW, computer supported cooperative work — поддерживаемая компьютерами со­вместная работа). В отличие от развернутого речевого общения процес­сы практического взаимодействия включают массу экстралингвисти­ческих, или «синпрактических», компонентов. Космонавт, пытающийся укрепить солнечную батарею, авиамеханик, находящийся внутри ре­монтируемого им двигателя, военный медик, делающий операцию, или мобильный робот, демонтирующий ядерный реактор, часто нуждаются в строго дозированной в пространстве и времени подсказке экспертов, иногда находящихся за сотни километров от места событий. Поиск ре­шения связан с предоставлением всем участникам общения наряду с акустическим каналом связи видеоизображения рабочей зоны, генери­руемого с помощью одной или нескольких телевизионных камер. Од­нако видеоизображение ситуации в целом еще недостаточно специфич­но, чтобы быстро и однозначно определить предметные референты практических инструкций типа «Соедини эту штуковину с той» или «Убери камень с правой стороны».

Некоторое время назад нами было предложено явно вводить в опосредованное компьютерами общение информацию о фокусе внима­ния и интенциях участников (Velichkovsky & Hansen, 1996). Речь идет прежде всего о поддержке операций совмещения внимания участника­ми общения. Эффекты совместного внимания (joint attention) и их взаи­модействие с речью хорошо известны из исследований онтогенеза (см. 7.1.2). Еще Выготский отмечал, что социализация внимания является важнейшим условием речевого и интеллектуального развития младен­ца. В первые месяцы жизни называние взрослым некоторого объекта увеличивает продолжительность его зрительной фиксации младенцем по сравнению с фиксацией других объектов, одновременно присутству­ющих в поле зрения (Bornstein, 1996). При возникновении речевой ком­муникации характер речи во время фаз «совместного внимания» и вне них оказывается различным как по семантике, так и по синтаксису (Tomasello, 1996). В дальнейшем мы остаемся чрезвычайно чувствитель­ны к направлению взора наших визави (нечувствительность к нему яв­ляется одним из важнейших диагностических признаков аутизма)*9. Можно сказать, что отслеживание и учет распределения внимания

49 Для изучения особенностей реагирования на другого человека в последнее время
успешно используются методики предъявления виртуальных антропоморфных агентов,
аватаров. Эти исследования (Helmert et al., 2005, Schilbach et al, 2005) свидетельствуют о
том, что очень похожие по психофизическим параметрам социальные стимулы могут об­
рабатываться на разных уровнях когнитивной организации в зависимости от личной вов­
леченности испытуемого, которая определяется прежде всего контактом «глаза в глаза»
(см. 9.4.2). 171

партнеров — одно из важнейших условий успешного общения и орга­низации совместной деятельности

Современные коммуникативные технологии, такие как электронная почта, интернет и видеоконференции, позволяют исключительно быст­ро, в режиме близком к реальному времени передавать гигантские объе­мы текстовой и визуальной информации При этом, однако, отчасти теряется важнейшая информация о динамике внимания участников об­щения В результате значительная часть диалогов участников видеокон­ференций посвящена не обсуждаемым проблемам, а самому процессу коммуникации («Кому ты это сейчас говоришь7»), а вероятность поле­тов менеджеров крупных корпораций друг к другу после проведения те­леконференций часто возрастает, а не уменьшается Применение осно­ванных на видеообработке систем регистрации движений глаз может быть необходимым дополнением существующих коммуникационных технологий Действительно, передача информации о том, где в предмет­ном окружении в данный момент находится точка фиксации и, следова­тельно (с известными оговорками — см 4 3 1), фокус зрительного вни­мания позволяет формировать состояния «совместного внимания», значительно облегчая решение конструктивных задач кооперативного типа (Vehchkovsky, 1995)50

Тот же прием делает возможным отслеживание социальной микро­динамики диалогов участников видеоконференций На рис 7 9А по­казана современная версия более ранней экспериментальной системы GAZE (ВЗОР), которая включала регистрацию направления взора участ­ников обсуждения (Vertegaal, Vehchkovsky & Van der Veer, 1997) Такая бес­контактная регистрация движений глаз, основанная на автоматическом слежении за зрачком в видеоизображении, упоминалась нами в одной из предыдущих глав (см 2 4 2) Если некоторый участник (партнер 1) об­суждения обращается к другому участнику (партнер 2), фиксируя лицо этого участника на экране компьютера, то на мониторах всех других партнеров изображение лица и глаза партнера 1 поворачиваются в на­правлении изображения лица партнера 2, так что доминирующая меж­личностная направленность обращения становится очевидной Путем высвечивания местоположения фокуса зрительного внимания (напри­мер, с цветовой маркировкой для идентификации участника) в совмест­ном рабочем поле данная методика делает также возможным выделение объектных референтов речи На рис 7 9Б показана еще одна современ-

50 Следует отметить, что зрительные фиксации могут выполнять несколько разных функций, таких как относительно поверхностная, амбьентная обработка или же фокаль­ная обработка, направленная на идентификацию объектов (см , например, 3 4 2) Комму­никативную нагрузку несут скорее продолжительные фиксации длительностью более 500 мс Фильтрация подобных фиксаций позволяет, кстати, использовать взгляд в качестве замены традиционной компьютерной мышки (Vehchkovsky & Hansen, 1996) Это важно при затруднениях в использовании рук и речевого ввода информации, в частности, пара­лизованными людьми В настоящее время во всем мире используется несколько сотен систем управления компьютерами (а следовательно, и множеством других технических систем) с помощью взора для инициации команд нужно просто чуть внимательнее по-172 смотреть на соответствующий иконический знак


Рис. 7.9. Системы виртуального общения, использующие информацию о направленно­сти зрительного внимания участников А Модификация более ранней лабораторной разработки, Б Современная промышленная система VR-видеоконференций (по Ве-личковскии, 2003)


ная коммуникационная система такого рода, используемая для проекти­рования новых изделий в автомобильной промышленности (с разреше­ния фирмы DaimlerChrysler)

Интересно, что проблема эксплицитного выявления фокуса вни­мания весьма остро стоит и в случае других современных коммуникаци­онных технологий Так, развитие собственно речевого взаимодействия с компьютерами и вообще разнообразными техническими системами


173


сдерживается тем обстоятельством, что существующие голосовые ин­терфейсы, к сожалению, не обладают способностью к селективному восприятию, например, в его специфической форме, известной в ког­нитивной психологии как эффект вечеринки (см. 2.2.1). Эти устройства просто пытаются обработать все, что произносится в непосредственной от них близости. Поэтому и здесь очень важной представляется задача разработки чувствительных к вниманию пользователя интерфейсов.

Выявление интенций представляет собой следующий, еще более сложный и важный этап в развитии технологических приложений ког­нитивных исследований по сравнению с описанными попытками вклю­чения параметров внимания в процессы коммуникации. Основная пер­спектива здесь состоит в создании совершенно нового, некомандного принципа взаимодействия человека и технических систем. Попробуем проиллюстрировать эту идею двумя примерами актуальных практичес­ких разработок. Первый пример уже кратко упоминался в этой главе, в разделе, посвященном чтению (см. 7.2.3). Почему иностранный язык нужно, по возможности, учить в живом общении с носителями языка? Потому что при межличностном взаимодействии происходит постоян­ное отслеживание затруднений партнера и поддержка предоставляется тогда, когда надо, и в объеме, который необходим для данной ситуации. Нельзя ли смоделировать подобную гибкую поддержку, оказываемую без эксплицитного запроса (то есть «без команды» — некомандный принцип) со стороны испытывающего затруднения пользователя и без обычного отвлекающего от контекста «путешествия» по словарям и тезаурусам?