Поскольку основная проблема инженерии знаний - это процесс извлечения знаний, разработчикам систем KM и в первую очередь аналитику необходимо четко понимать природу и особенности этих процессов. Можно выделить три основных аспекта процесса извлечения знаний:
A = {A1, А2, А3} = {психологический, лингвистический, гносеологический}.
Следует отметить, что даже если речь идет о разработке традиционной информационной системы, а не системы KM, проблемы инженерии знаний не теряют своей актуальности.
Из трех аспектов извлечения знаний наиболее важен психологический (А1), поскольку он определяет успешность и эффективность взаимодействия (общения) аналитика с основным источником знаний - специалистами предприятия.
Существует определение термина приобретение знаний: "Передача и преобразование опыта решения проблем, полученного от некоторого источника знаний, в программу".
Термин приобретение знаний носит обобщенный характер и совершенно нейтрален к способу передачи знаний. Например, передача может осуществляться с помощью специальной программы, которая в процессе обработки большого массива историй болезни устанавливает связь между симптомами и заболеваниями. А вот термин извлечение знаний относится именно к одному из способов передачи знаний — опросу экспертов в определенной проблемной области, который выполняется аналитиком или инженером по знаниям. Последний затем создает компьютерную программу, представляющую такие знания (или поручает это кому-нибудь другому, обеспечивая его всей необходимой информацией).
Этот же термин применяется и для обозначения процесса взаимодействия эксперта со специальной программой, целью которого является:
· извлечь каким-либо систематическим способом знания, которыми обладает эксперт, например, предлагая эксперту репрезентативные задачи и фиксируя предлагаемые способы их решения;
· сохранить полученные таким образом знания в некотором промежуточном виде;
· преобразовать знания из промежуточного представления в вид, пригодный для практического использования в программе, например в набор порождающих правил.
Преимущество использования такой программы — снижение трудоемкости процесса, поскольку перенос знаний от эксперта к системе осуществляется в один прием.
Стадии приобретения знаний
Можно выделить несколько стадий приобретения знаний.
(1) Идентификация. Анализируется класс проблем, которые предполагается решать с помощью проектируемой системы, включая данные, которыми нужно оперировать, и критерии оценки качества решений. Определяются ресурсы, доступные при разработке проекта, — источники экспертных знаний, трудоемкость, ограничения по времени, стоимости и вычислительным ресурсам.
(2) Концептуализация. Формулируются базовые концепции и отношения между ними. Сюда же входят и характеристика различных видов используемых данных, анализ информационных потоков и лежащих в их основе структур в предметной области в терминах причинно-следственных связей, отношений частное/целое, постоянное/временное и т.п.
(3) Формализация. Предпринимается попытка представить структуру пространства состояний и характер методов поиска в нем. Выполняется оценка полноты и степени достоверности (неопределенности) информации и других ограничений, накладываемых на логическую интерпретацию данных, таких как зависимость от времени, надежность и полнота различных источников информации.
(4) Реализация. Преобразование формализованных знаний в работающую программу, причем на первый план выходит спецификация методов организации управления процессом и уточнение деталей организации информационных потоков. Правила преобразуются в форму, пригодную для выполнения программой в выбранном режиме управления. Принимаются решения об используемых структурах данных и разбиении программы на ряд более или менее независимых модулей.
(5) Тестирование. Проверка работы созданного варианта системы на большом числе репрезентативных задач. В процессе тестирования анализируются возможные источники ошибок в поведении системы. Чаще всего таким источником является имеющийся в системе набор правил. Оказывается, что в нем не хватает каких-то правил, другие не совсем корректны, а между некоторыми обнаруживается противоречие.
В этом разделе рассмотрены особенности процедуры взаимодействия инженера по знаниям с источником знаний (экспертом), позволяющей сделать явными рассуждения специалистов при принятии решений и структуру их представлений о предметной области.
Процедура взаимодействия инженера по знаниям с экспертом
Известен парадоксальный факт Джонсона о том, что по мере накопления опыта специалист-эксперт все больше утрачивает умение словесно выражать свои знания. Имеются достаточно убедительные психологические доказательства того, что люди далеко не всегда в состоянии достоверно описать свои мыслительные процессы. Теоретик искусственного интеллекта Марвин Минский писал, что «самосознание — это сложная, но тщательно сконструированная иллюзия...» и что «.. .только как исключение, а не как правило, человек может объяснить то, что он знает».
Другое психологическое положение состоит в том, что опыт эксперта — это интуиция, которая трудно поддается выражению в форме правил типа «ЕСЛИ — ТО». Широко известно высказывание Лао-Цзы («старого учителя»): «Кто скажет, тот не знает, кто знает, тот не скажет».
Тем не менее, инженерия знаний предлагает определенные методы (приемы, способы) работы с экспертами. Эти методы направлены на «раскручивание» лабиринтов памяти экспертов, в которых хранятся знания, часто имеющие невербальный характер.
Классификация методов работы с экспертами
В основу излагаемого материала положена классификация коммуникативных методов работы инженера по знаниям.
Под коммуникативными методами понимают все виды контактов инженера по знаниям с живым источником знаний — экспертом. Среди этих методов выделяют две большие группы: активные и пассивные (рис. П.21).
Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний принадлежит эксперту. При этом инженер по знаниям главным образом протоколирует рассуждения и действия эксперта.
В активных методах инициатива полностью в руках инженера по знаниям. Он ведет с экспертом беседу, предлагает различные «игры», организует «круглый стол» и т. д.
Пассивные методы на первый взгляд просты. Вместе с тем, они требуют от инженера по знаниям умения анализировать «поток сознания» эксперта и выделять в нем ценные фрагменты знания.
Активные методы разделяют на две группы в зависимости от числа экспертов, участвующих в процедуре извлечения знаний. В групповых методах большое значение имеет дискуссия между экспертами, в которой нередко выявляются нетривиальные аспекты знаний. В то же время, ведущую роль на сегодняшний день играют индивидуальные методы. В значительной степени это связано с деликатностью процедуры «отъема знаний».
Пассивные методы
Наблюдение
Метод наблюдения является единственным «чистым» методом, где инженер по знаниям не вмешивается в процесс работы эксперта и не навязывает ему какие-либо собственные представления. Выделяют две разновидности наблюдений:
· Наблюдение за реальным процессом.
· Наблюдение за имитацией процесса.
Сначала обычно применяют первую разновидность и наблюдают за реальным процессом на рабочем месте эксперта. Это помогает глубже понять предметную область и отметить все внешние особенности процедуры принятия решений, необходимые для проектирования интерфейса пользователя.
На втором этапе эксперт имитирует процесс. В таком режиме он менее напряжен и работает на «два фронта» — ведет профессиональную деятельность и одновременно демонстрирует ее.
Сеансы наблюдений предъявляют к инженеру по знаниям следующие требования:
· Владение техникой стенографии.
· Знакомство с методиками хронометрирования для четкого структурирования производственного процесса во времени.
· Развитые навыки «чтения по глазам», то есть наблюдательность к жестам, мимике и другим невербальным компонентам общения.
· Предварительное знакомство с предметной областью.
Протоколы наблюдений после проведения сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.
Анализ протоколов «мыслей вслух»
При протоколировании «мыслей вслух» эксперта просят раскрыть всю цепочку рассуждений, объясняющих его действия и решения. При таком протоколировании считается важным зафиксировать не только весь «поток сознания» эксперта, но даже паузы и междометия в речи эксперта. Иногда данный метод называют «вербальными отчетами».
При протоколировании «мыслей вслух» эксперт может проявить себя максимально ярко. Он ничем не скован, ему никто не мешает, он как бы свободно парит в потоке собственных рассуждений и умозаключений, может блеснуть своей эрудицией и продемонстрировать глубину познаний. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.
Вместе с тем, как отмечалось выше, далеко не каждый специалист, даже из числа умеющих произносить впечатляющие монологи о своей работе, оказывается в состоянии формализовать и структурировать рассуждения. Однако существуют люди, склонные к рефлексии, способные к конструктивному изложению мыслей. Такие люди — находка для инженера по знаниям.