Словари из символов бывают различными у разных народов или государств. В информатике используется чаще всего клавиатура с клавишами из символов стандарта ASCII. Он включает кроме цифр и общепринятых знаков два регистра букв латинского алфавита и два регистра букв национального алфавита. В отдельных науках или отраслях знаний используются и другие словари из символов. Флажковый алфавит моряков, азбука Брайля для слепых, дорожные знаки - только три примера из огромного числа алфавитов. Информатике под силу использование таких и других алфавитов с помощью одного алфавита ASCII. Для использования символов не из этого алфавита составляются последовательности символов алфавита ASCII, которые обозначают требуемые символы другого алфавита. В Интеллсист находятся несколько словарей из символов, которые могут вызываться для составления последовательностей из символов при передаче системе знаний.
Из символов алфавита составляются последовательности, которые называются словами. В информатике не имеет значения, из каких символов составлено слово. В слово может входить буква, цифра или знак, отличный от буквы или цифры. Слова обычно выделяются в последовательности символов проблемами или знаками, не входящими в слова. Например, А+В может быть словом, а может быть последовательностью слов А, +, В (слова из букв А и В разделены знаком + и пробелами). Слово или термин «по-видимому» формально является формулой «по минус видимому». Этот термин может использоваться в запросах для решения задач.
В информатике принято считать словами последовательности букв и цифр, начинающиеся буквой. Только такие слова воспринимаются в Интеллсист в качестве слов. Слова в некоторых обобщениях могут состоять из других знаков в любом порядке в последовательности. Интеллсист рассматривает только те слова, которые более всего совпадают со словами, используемыми в различных ЯПП. Слова в информатике обозначаются с использованием средств, которые шире средств ЕЯ общения людей. Слова ЕЯ расширены в результате разрешения запросов пользователей самых разных специальностей. Таковы правила СиГ для различных ЯПП, они позволяют строить слова по строгим правилам.
Последовательность слов в ЕЯ образуют словосочетания или термины. Для ЯПП правила образования терминов расширены. В силу СеГ термином может быть слово, знак или конечная последовательность из знаков и слов, даже состоящая только из одного или нескольких знаков или только из слов. Здесь опять сталкиваемся с запросами пользователей различных специальностей. Состав терминов, построенных по правилам СеГ, намного шире состава терминов, построенных по правилам СиГ. Интеллсист должна обеспечить написание и разрешение запросов пользователей различных специальностей и специализаций. Интеллсист в решении логических уравнений ориентируется на словари из слов. Сообщаемые через БЗ или запросы определения терминов включают слова, которые должны быть учтены на всех этапах обработки знаний и запросов. В связи с этим слова собираются в словари независимо от того являются ли они терминами или частями терминов. Словарь необходим для идентификации терминов и построения подсказок
В СеГ каждый текст состоит из последовательности терминов. Термины по текстам могут определяться автоматически, если размеры текста велики. Например, автоматически можно построить терминологический словарь для текста, состоящего из 1000 файлов и более. Такой метод составления словаря подчиняется законом теории вероятности. Каждая область знания имеет свой словарь, который не подчиняется случайным факторам. В связи с этим возникает проблема составления стандартных терминологических словарей в каждой области знания.
В настоящее время созданы терминологические словари по многим областям знаний. Они предназначены для человека и содержат термин и его определение. В Интеллсист, кроме «определения для человека» необходимо для каждого термина построить его характеристики в соответствии с требованиями к системе. Конечно, можно решать и такую задачу: Интеллсист автоматически составляет словарь и снабжает каждый термин характеристикой «абстрактный». В процессе логического вывода каждый термин будет доопределяться более точными свойствами и характеристиками. Этот процесс приведет к появлению большого числа вопросов пользователю или значительного числа вариантов ответов. Описанная ситуация реальна и может использоваться для изучения текстов знания.
Терминологический словарь Интеллсист существенно отличается от известных словарей. Отличие строится на составе терминов. Чаще всего в известных словарях термин формируется из одного слова в расчете на широкое использование термина. Конкретная область знаний использует эти термины только в составе других терминов (как часть). Поэтому словарь для Интеллсист должен создаваться автономно либо по записи знаний, либо знаниеведом. Второе существенное отличие состоит в том, что каждый термин не снабжен характеристиками, которые должен формировать специалист по меню системы.
Конечно, при создании терминологического словаря для Интеллсист определения терминов пригодятся в полном объеме или частично, поскольку определения нужны для пользователя в качестве справки. Всякий раз, когда возникает вопрос или противоречия в знаниях пользователь может нажать над термином кнопку F1 и прочитать на экране данное определение. Иногда термин не снабжается определением, так как сам термин (комбинация слов и знаков) самоопределяется по своему имени. Характеристики каждого термина также по меню можно прочитать и удостовериться в его правильности или глубже понять смысл термина.
Интеллсист позволяет отпечатать терминологический словарь при создании твердой копии либо вместе с характеристиками, либо без них. Автоматическое создание словарей в процессе их модификаций полезно для подготовки издания словарей, хотя словарь в Интеллсист может оказаться полезнее, так как доступ к термину более оперативен и имеется возможность сопоставления терминов или их характеристик.
4.4. Терминологический словарь
Поскольку термин является средством обозначения понятия с заданным изначально смыслом, важным для работы Интеллсист является терминологический словарь (лексикон). Сегодня имеется значительное число терминологических словарей для применения человеком в различных областях знания. Они все составлены по принципу соответствия слова или обобщенные словосочетания текстовому определения смысла термина. Все они могут использоваться для построения машинных словарей. По определению термина можно составить его характеристики так, чтобы с помощью инструментария Интеллсист можно было бы составить лексикон. Однако степень формализации понятия в его определении весьма мала. Поэтому применение существующих терминологических словарей предполагает значительную работу по формализации характеристик понятий.
Главным отличием терминологических словарей для человека и Интеллсист является различие в составе словарей. Хотя словари для человека ориентируются на язык специальности, тем не менее, они зачастую не содержат профессиональные термины. Например, редкими являются словари, содержащие термины «H2O» или «258-12-41». В лексиконе химика или телефониста такие или аналогичные термины появляются и используются. Итак, первое отличие у двух видов словарей состоит в различии наборов терминов.
Второе отличие состоит в том, что лексикон должен содержать полные характеристики понятия, в то время как словарь для человека содержит только описательные определения термина, которые также могут помещаться в лексикон. К характеристикам термина относятся ссылки, дата, значения, тип, вид, сорт и паспорт для структурных величин.
В приложении приведен терминологический словарь по информатике, который ориентирован на человека и используется в справочной подсистеме Интеллсист для пояснения терминов, помещенных в Индекс. По нему можно обнаружить различия словарей для человека и Интеллсист. В инструментарии Интеллсист имеются средства для печати формируемого в лексиконе терминологического словаря, который может составить черновой набросок словаря для человека. С этих позиций Интеллсист является накопителем словарей и для человека.
4.5. Представление знания
О представлении знаний говорилось достаточно. Тем не менее, еще несколько фраз могут прояснить формы внешнего и внутреннего представлений знаний. Правила внешнего представления формально описаны в грамматике ЯПП. Правила внутреннего представления косвенно содержатся в описании ФЯ Лейбниц. В связи с этим уделим большее внимание внутреннему представлению для того, чтобы точнее понять различия СУБД и СУБЗ.
Все утверждения (выражения или формулы), которые используются для записи знаний или запросов, в памяти Интеллсист представляются двоичным деревом. Каждое двоичное дерево состоит из веточек (вершина-операция и две ссылки на две другие веточки), которые хранятся в массиве. Связь веточек в деревья осуществляет информация о верхушках всех автономных деревьев, которые группируется в кортежи предрешений и решений задания. Это главная часть кода БЗ, содержащего сведения об утверждениях. Другая часть БЗ - лексикон - имеет свои форматы представлений. Кроме этого имеется 25 массивов информации о свойствах и значениях понятий словаря.
Термины лексикона также представляется двоичным деревом или графом «и-или». «и» соответствует операции соединения частей термина в единую конструкцию, а «или» - операции альтернативного или вариантного выбора частей термина. Элементарная конструкция, соответствующая вершине и двум ссылкам на другие вершины, является веточкой лексикона. Содержательная часть веточки включает номер слова, лексемы или знака (из термина) и ссылку на характеристику понятия.