Накопление фактического материала можно осуществлять через БД с помощью СУБД. Едва ли стоит серьезно учитывать в этой проблеме накопление фактов путем сообщения величинам их начальных значений или ввода массивов и записей данных перед реализацией вычислений. Интеллсист ориентирована на использование СУБД, что позволяет рассматривать задания, связанные с обработкой емких материалов по фактам, представленным в табличной форме.
Целью работы Интеллсист является получение новых фактов или программ для динамического вычисления новых фактов. Формализация знаний и накопление фактического материала определяют уровень интеллектуальности системы. Этим утверждением завершается рассмотрение систем обработки знаний и главы об основных понятиях информатики. Рассмотрим другой метод реализации системы обработки знаний, который ждет своей реализации.
1. Применения СиГ (смысл по графу связи). Попытки выявления и применение знаний только по СиГ в целом не лишены оснований, хотя любые попытки в ограничении только ее средствами приводит к неуспеху. Применение СиГ возможно в решениях задач, когда смысл текста имеет интуитивный характер. Можно сказать так: формирование и поиск интуитивного смысла может быть реализовано только средствами СиГ. Здесь кратко рассмотрим постановку одной проблемы концептуальной информатики: применения СиГ. Несколько подробнее о ней сказано в т.4, разделе 5.5.1, где рассматривается теория веры.
Накопление знаний в рассматриваемом случае осуществляется методом ведение беседы для выяснения сути происходящего. Беседа фиксируется в памяти в форме вопрос-ответ. Рассуждение с вопросами и ответами предназначено для установления гипотезы, поиска ответов на вопросы или научной истины. Представление элементарного знания имеет форму <текст, граф>. Под текстом понимается слово, знак, лексема или комбинация этих объектов. Под графом понимается граф связи слов, лексем и знаков препинания.
Любая грамматика передает знания (т.2). Этот тезис является здесь основным, его и попробуем установить. Теперь рассмотрим СиГ для определения возможностей вычисления приближенного смысла. Задачи с установлением правоты текстов возникают часто:
· обоснование гипотез,
· поиск ответа на вопросы,
· выяснение обстоятельств, в которых проявляется события,
· исследование результатов деяний,
· построение хода рассуждений по заданной теме и др.
Возможно, что некоторые сведения из СеГ будут использоваться в процессах применения СиГ, поскольку эти две грамматики обслуживают один и тот же язык, один и тот же лексический состав языка.
Прежде необходимо выяснить вопрос переноса знаний с помощью СиГ. СиГ, напомним, определяется алфавитом, правилами построения слов и предложений. Возьмем в качестве догмы следующее положение: каждое предложение может быть истинным или ложным, допустимым или не допустимым, оно может иметь любую квалификацию, которую определяет сам пользователь. Таким образом (важное обстоятельство) закон исключенного третьего не действует вообще. Вообще же, операции алгебры логики не учитываются явно. При этом важно согласованность слов и предложений, непротиворечивость утверждений, полнота и независимость совокупности предложений. Проблема определения понятия знание усложняется. Тем не менее, понятия знание необходимо установить, иначе невозможно разрешать какие-либо жизненно важные проблемы (вопросы, запросы, задачи, гипотезы и др.). Потенциальное применение связано со многими областями деятельности человека:
· ведение следствия или суда (юриспруденция),
· начальный научный поиск свойств вещей, закономерностей или классификаций,
· оценка значимости произведений искусства и литературы,
везде, где текстуально документируются содержательные факты и утверждения.
Ранее была высказана мысль о том, что передача знаний с квалификацией их значениями лжи и истины с помощью СиГ невозможна. Но с помощью СиГ можно передавать знания с квалификацией, которая известна только пользователю, а не системе обработки знаний. СиГ не декларирует понятие логического смысла фраз или предложений. Однако СиГ можно использовать для разрешения вопросов и гипотез, не требующих знания лжи или истины (теория веры).
Подойти к понятию знание с указанных позиций можно только с пониманием сущности правил СиГ. Любое правило СиГ определяет, какие знаки, цифры, буквы (символы) образуют слова и предложения, а также их разделители (с помощью операции соединения). В основе представления знаний на базе СиГ лежит операция соединения лексических элементов таких, как слово, число, строка и знаки препинания. Любое предложение является единицей языка. Оно формализуется простым линейным графом, в узлах которого помещаются лексические элементы, а дуга символизирует операцию соединения. Весь текст тогда представляется совокупностью графов. Теперь можно перейти к формальному определению знания. Знания - это текст, используемый как имя данного, и представляющий его граф, являющийся смыслом текста. Под БЗ понимается совокупность элементарного знания, проверенная по всевозможным критериям грамматической правильности, непротиворечивости, независимости и полноты.
Общее определение понятия знание не исключает наличие БД с фактическими материалами. Понятие факта для СиГ можно было бы расширить за счет того, что каждая пара (текст, граф) также можно понимать как факт. Но тогда дело применения нового определения знания на основе СиГ было бы чрезвычайно затруднено, поскольку теория фактов строго не определяется.
2. Постановка цели. Интуитивно понятие цели известно в случае изучения и обработки знаний, извлекаемых из текстов, которые составлены по правилам СиГ. При обработке знаний на основе СиГ возникают различные цели. Рассмотрим лишь несколько из них. Всеобщее применение СиГ невозможно, хотя и имеются попытки разрешить эту проблему (например [Хомский96]). СиГ целесообразно использовать для разрешения или синтеза вопросов в диалогах человека с ВМ. Разрешение вопроса или гипотезы может привести к постановке новых целей или подцелей, которые продолжают диалог в системе человек-ВМ до некоторого конечного результата.
В представлении знаний парой (текст, граф) достаточно хорошо известно по описанию СиГ понятие текста. Действительно, граф в применениях СиГ состоит из множества вершин или узлов и множества пар (или дуг) из двух узлов. Кроме этого, каждая компонента графа интерпретируется или нагружается следующими атрибутами. Узлу соответствует лексический элемент, а дуге - операция соединения лексических элементов. Узлу при кодировании соответствует:
1. номер лексического элемента,
2. код признака или квалификации лексического элемента (слово, знак, лексема, табличный элемент и др.),
3. код конца слова, если лексический элемент является словом,
4. ссылка на кластер слов, если узлу соответствует не одно слово,
5. ссылка на продолжение или конец графа (код дуги),
6. номер семантического преобразования, связанного с этим графом.
Эта нагрузка графа необходима для эффективной обработки знаний. Вся совокупность графов содержательно подразделяется на стандартные и диалоговые графы. Графы, представленные полной совокупностью, технически сложны для обработки и не всегда интерпретируемы как представления знания. Поэтому крайне необходимы средства для обобщения графов. Над графами определяются операции.
3. Классы графов представления текстов. Графами представляются многие объекты информатики. В т.2 подробно рассматривался граф языка. Построение графов приведет к формированию графа языка конкретного диалога. Это один из главных тезисов применения СиГ.
4. БД для хранения знаний, представленных по СиГ. Знания, внутренне представленные на ФЯ, хранятся аналогично тому, как они хранятся в представлениях по СеГ. Здесь следует отметить отличия в составе файлов, поскольку в представлениях знаний преобладают факты. Поэтому достаточно средств СУБД сохранения словарей из слов с пометкой о составе синонимов, выписок из беседы для использования их при проработке всех версий, исходных (и стандартные) знаний и др. Структура БД включает в себя наименование класса данных (автомобиль, дом, улица и т.п.) и столбцов таблиц, являющихся самостоятельной разработкой, исходя из реалий применения.
5. Заключительные замечания. Имеется еще достаточное число способов представления знаний парами (имя, значение). Об этом говорилось ранее. Для каждого способа следует рассматривать аналогичные разделы концептуальной информатики, по которым устанавливается метод внешнего и внутреннего представления, цели и задачи применения, алгоритмы обработки, внешнее представление результатов, применение имеющихся Интеллсист и др.
Глава 3. Основные концепции определения понятий
Для работы Интеллсист со знаниями и запросами необходимы сведения о терминах, они передаются системе при их определении с помощью меню. Для понимания средств описаний терминов рассматриваются общие понятия о методах формирования их определений. В этом разделе реализована компиляция известного из лингвистики и прикладной логики материала с частичной и незначительной его трансформацией с целью учета приемов, диктуемых новым определением информатики. Описание основных концепций несет отпечаток формализма и лишен в большинстве случаев детального пояснения с привлечением красочных примеров и вспомогательных пояснений и рассуждений. До формирования средств определения понятий необходимо рассмотреть те факторы, которые в обязательном порядке присутствуют в процессах определения. Факторами являются атрибуты, свойства, назначение, классификация и функции определений понятия. Рассмотрим их последовательно.
3.1. Атрибуты определения понятий