Формализация знаний: методы и приемы. Их эффективность, сравнительный анализ[1]. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний.
Представление знаний это процесс, конечная цель которого поместить некоторый объем знаний в своеобразную " упаковку" в которой он может начать движение по каналам информационного обмена, дойти до получателя, или задержаться в пунктах хранения знаний. Такой упаковкой может быть фраза устной речи, письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.
Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия. Назовем такую систему правил формализмом представления знаний.
Самым естественным, подходящим для человека формализмом является язык ( устная речь и письменность). Без знаний, без постоянной работы по их упаковке в языковые конструкции язык мертв. Он живет и развивается благодаря творческой энергии человека, благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода в выраженную в языке форму. Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существуют десятки различных определений понятий здоровье, интеллект, мышление, информация и т.п. Отмечая эту ограниченность выразительных средств языка, Ф. Энгельс писал:" Дефиниции не имеют значения для науки, потому что они всегда оказываются недостаточными". Мысль, которую нельзя выразить в языковой конструкции, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному
знанию можно придать различную словесную или текстовую форму. Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д. Богатство языка это и богатство культуры того или иного народа.
Вместе с тем, в некоторых областях деятельности людей это богатство и разнообразие выразительных средств естественного языка становится скорее недостатком, чем достоинством. Например, слова команды должны быть короткими, резкими, иметь однозначный смысл, иначе не получится согласованных и четких совместных действий подчиненных. В специальных отраслях науки формируются специфические языковые системы, являющиеся как бы " сужением " естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют химия, физика, философия и т.д.
Целесообразность применения таких суженных языковых систем (диалектов), позволяет повысить надежность процессов информационного обмена, т.к. возможность неправильного истолкования передаваемой информации снижается. При этом , конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим диалектом. Главные достоинства суженного языка - возможность создавать и использовать типовые, "стандартные " упаковки знаний, а также в значительной мере снять полисемию ( смысловую многозначность), присутс
твующую в естественном языке.
Полисемия - враг информационного обмена, фактор внесения искажения и ошибок ( семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто " концеляритом " , является естественным шагом на этом пути, огромной работой общества на протяжении ряда столетий. Сопоставление этой подсистемы естественного языка с литературным языком показывает насколько они различны по характеристикам, определяющим их выразительную способность.
Так "канцелярит" предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, информативен (в противоположность информационной избыточности), ему присуща логичность, он по характеру алгебраичен (мысль, информация, знание развернуты в последовательность слов и предложений, постепенно формируясь в полном, законченном виде к завершению текста). Все эти свойства не являются обязательными для языка литературы, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность (геометричность) высказываний и т.д.
Дальнейшее продвижение в сторону формализации знаний приводит к понятиям класс и классификация. Классификация - распределение предметов, объектов и понятий по группам (классам) по обнаруженным свойствам. В любой складывающейся науке одним из первых принципов являлся принцип систематизации знаний. Поэтому классификация как метод научной систематики сразу же стала играть важную роль в формировании ядра знаний того или иного научного направления. Достаточно вспомнить классификационную систему К. Линнея в ботанике, систематику живых организмов и т.п. Классификационные системы такого типа имеют выраженную иерархическую структуру, в силу которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением "старший - младший": тип, класс, отряд, семейство, род, вид.
Примером классификации такого типа где родо-видовые отношения пронизывают всю структуру соответствующих знаний может служить известная "табель о рангах", введенная Петром 1 в 1722 г. Табель о рангах подразделяла чины на 14 рангов. Каждому чину соответствовала определенная должность. Первые 6 рангов статской и придворной служб и первый обер-офицерский чин в армии давали право на получение потомственного дворянства, что способствовало формированию дворянской бюрократии.
Мы видим на этом примере, что классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка. Поэтому существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель знаний получила в науке и практике название " иерархической". Ее достоинства в том, что она проста в освоении, легко поддерживается в рабочем состоянии (легко пополняется и "чистится"), эффективно решает задачу разнесения новых понятий по иерархическим уровням.
Недостатки иерархической модели знаний: - прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; - иерархическая классификация наиболее эффективна в тех случаях, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родо-видовой.
Систематика, лежащая в основе классификации может применяться как сильное средство направленного исследовательского поиска. Так, иногда оказывается полезным при рассмотрении группы объектов несколько каких-либо характерных для них признаков выделить в качестве определяющих и ввести некоторую меру степени проявления данных признаков. Такой подход называется морфологическим, так как использует идею разложения некоего объекта на его части (признаки). Часто подобная группировка приводит к выявлению закономерностей связывающих объекты каждой группы, которые до этого не были известны.
Благодаря такому подходу Д.И.Менделеев открыл знаменитый периодический закон. Подчеркивая доминирующую роль выделенного им признака он писал: "...по смыслу всех точных сведений о явлениях природы масса вещества есть именно такое свойство его, от которого должны находиться в зависимости все остальные свойства ... Поэтому ближе или естественнее всего искать зависимости между свойствами и сходствами элементов, с одной стороны, и атомными их весами, с другой " .
Морфологический метод осуществляет как бы анатомическое исследование объектов, понятий, значений путем расчленения целого на характерные, существенные части. Его цель - выяснение роли частного в целостной картине, систематизация знаний о данной реальности, составление гипотез о возможных вариантах новых (еще не данных) знаний. Упомянутые выше недостатки иерархической модели данных свойственны и морфологическим моделям. Их удается устранить используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний. Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как в иерархической модели это могут быть родо-видовые отношения, но так же и другие типы отношений: "быть представителем", "иметь", "наследовать" и т.п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить "динамизм" системы знаний. Действительно, система знаний, представленных иерархической или морфологической моделями статична, или, как говорят, декларативна.
В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей получая формулы дедуктивного (от частного к общему), индуктивного (от общего к частному) и индуктивно-дедуктивного выводов.
Например: " растение может быть цветком по имени роза"; "роза - цветок, часть растения"; "роза - цветок, имеющий лепестки".