Смекни!
smekni.com

Изобретание, проектирование, разработка и сопровождение) Том Интеллектуальные системы (Системы решения проблем)  Альберт Александрович Красилов (стр. 6 из 85)

2.1. Концепция синтаксиса языков

Синтаксис любого языка охватывает обширный круг вопросов по изучению и применению правил образования слов (более обще – лексем и имен терминов) и предложений, составленных из слов, лексем и знаков. Понятие синтаксиса используется в равной мере при построении ЕЯ и ФЯ. Совокупность синтаксических правил ЕЯ значительно емче совокупности синтаксических правил ФЯ. Это объясняется весьма важным обстоятельством. ЕЯ передает не только знания (в чистом виде), но и эмоциональную информацию, и дополнительные сопутствующие сведения, которые, скорее всего, относятся к разряду знаний о знании конкретного человека, написавшего текст на ЕЯ. Для ФЯ подобная информация не используется, она является второстепенной и устраняется при формализации знаний. Исключением является случай построения ФЯ для анализа эмоциональной информации. Именно в силу таких обстоятельств каждая книга содержит знаний от 5% до 15% объема книги, полезных для их ввода в Интеллсист по специальности, которую провозглашает книга.

В описании любого языка синтаксис является центральной частью для конструирования текстов. Он определяет все конструкции, допустимые в языке. Определение конструкций осуществляется по правилам синтаксиса. Для ЕЯ правила построения задаются описательно по типу «делай так» или «правильно будет так». Объем описания велик, поскольку в ЕЯ имеется большое количество исключений из правил и пояснительных примеров. Для ФЯ правила построения задаются формальными грамматиками чаще порождающего и реже распознающего типа. Использование порождающих грамматик для описания ЕЯ малопродуктивно в задачах распознавания правильности написания текстов, несмотря на то, что сами порождающие грамматики возникли из желания формализовать ЕЯ [Хомский61]. Объем описания грамматик ФЯ невелик, он оценивается несколькими сотнями компактных записей правил. Запись грамматики можно осуществить средствами языка Марков, который представлен в томе 2. Объем описания грамматик ЕЯ с помощью формализма оценивается несколькими тысячами не очень компактных записей правил. Формализация знаний допускает игнорирование большого числа правил синтаксиса ЕЯ без какой-либо потери знаний. Например, изменение по падежам термина «белый аист» будет обозначать по смыслу белого аиста. В исключительных случаях для терминов необходимо вводить синонимы, поскольку изменения слов по падежам изменяет основу слов. Например, слова «колечко» и «колечек» имеют одинаковый смысл в данном применении. Слово «колечек» является синонимом для термина «колечко», если множественное число не играет никакой самостоятельной роли.

Самым примечательным свойством синтаксиса является тот факт, что он вводит все грамматические понятия (грамматические категории), на которые ориентируются все системы обработки знаний, в особенности системы перевода текстов на другой язык. Грамматические категории являются метапонятиями в языке. Для русского языка целевым метапонятием является «русский язык», для языка программирования - «программа». Другими словами, грамматические категории являются наименованиями подъязыков. Например, именами подъязыков ЕЯ являются «глагол», «падеж», «окончания» или «число». Знание метапонятий важно не только в учебных целях, но и с целью манипуляций с текстами при грамматическом разборе и переводе их на другой язык.

Первая практическая польза синтаксиса состоит в том, чтобы анализировать тексты с целью поиска в них синтаксических ошибок. Интеллсист обнаруживает 13 классов ошибок, среди которых имеется класс синтаксических ошибок. Поскольку все правила конструирования текстов известны, программы анализа текстов осуществляют автоматический поиск всех синтаксических ошибок. Это важное обстоятельство для подтверждения правильности текстов. Все правила синтаксиса описывают строгий порядок в написании любых частей текста, нарушение правил должно обнаруживаться в первую очередь, что обеспечивает недопущение текстов в дальнейшую обработку. Синтаксические ошибки, и это правильно, позволяют обнаруживать некоторые смысловые ошибки, но только косвенно. Например, в тексте имеется фраза вида «запись (или таблица( имеют поля» содержит синтаксическую ошибку в использовании скобок. Правильной будет фраза «запись (или таблица) имеют поля». Кажущаяся простота синтаксических ошибок становится сложной, поскольку только размеры фраз определяют простоту или сложность ошибки. Простых ошибок не бывает, описки могут стоить дороже глубокой смысловой ошибки.

Знание синтаксиса важно при освоении любого языка. С помощью синтаксиса осуществляется обучение языку. Описательное представление синтаксиса обычно устраивает пользователя. Однако имеется один важный способ представления синтаксиса, который именуется синтаксической диаграммой, в соответствии с распознающей грамматикой (см. т.2), такие диаграммы именуются графами языков. Граф языка имеет определенную обозримость и более всего приспособлен для ускорения обучения языку. В этом можно убедиться при анализе графа языка Лейбниц.

Имеется еще одно важное свойство синтаксиса, которое состоит в том, что с его помощью частично определяется смысл текстов. Конечно, полностью полагаться только на синтаксис для установления полного смысла текстов нецелесообразно [Логический98, Минский79, Хомский96]. Семантические сети отражают синтаксис и строятся благодаря известному смыслу объектов, они не пригодны для установления смысла. Многие программы используют графовые конструкции для указания взаимосвязей слов, словосочетаний и предложений, построенных по правилам синтаксиса, но они также не разрешают проблемы вычисления смысла текстов. Поэтому синтаксис используется для конструктивного анализа текстов и для определения грамматического смысла конструкции, он почти не используются для вычисления передаваемого текстом смысла. Например, условное предложение позволяет частично определить смысл высказывания как следование, но из синтаксического анализа никак нельзя определить смысл всего предложения. Это обстоятельство и привело к построению СеГ, элементы которой включаются в стандартную часть любого лексикона.

Правила синтаксиса полностью используются для построения грамматических анализаторов текстов. В этом главная заслуга синтаксиса перед информатикой. Все трансляторы построены по синтаксису языка для обнаружения ошибок и для подготовки сведений о применении правил вычисления смысла, которые применяются затем независимо от той или иной синтаксической конструкции. Например, вначале по правилам синтаксиса определяется правильность записи формулы А + В, затем применяются правила интерпретации операции сложения для получения смысла этой формулы без привлечения правил синтаксиса.

Последнее свойство концепции синтаксиса состоит в том, что метапонятия (грамматические категории) образуют систему (в частности терминологический словарь имен подъязыков), полностью характеризующую конструктивную структуру данного языка. Словарь метапонятий определяет совокупность подпрограмм осмысления или перевода текстов на другой язык.

2.2. Концепция семантики языков

Семантика любого языка охватывает обширный круг вопросов по изучению и применению правил выявления или вычисления смысла (или значения) текстов. Она определяет смысл исходных элементов языка (слов, словосочетаний или терминов). На основе этого определяется смысл любой синтаксически правильной конструкции. При определении смысла текста весьма важную роль играет контекст каждого слова, термина и предложения. ФЯ обычно в описаниях семантики учитывают главным образом контекст использования конструкций, определяемых синтаксически. Понятие семантики используется в равной мере при построении ФЯ и ЕЯ (меньше). Совокупность семантических правил для ЯПП (они составляют СеГ) значительно емче совокупности семантических правил ФЯ. Ведь они определяют контекстные условия применения синтаксических конструкций и правила получения значений фраз. Это объясняется весьма важным обстоятельством, аналогичным обстоятельствам, оговоренным для синтаксиса. ЕЯ передает не только знания (в чистом виде), но и эмоциональную информацию, и дополнительные сопутствующие сведения, которые относятся к разряду знаний о знании конкретного человека, написавшего текст на ЕЯ. Семантика определяет смысл текстов или его частей (фраз). В этом главное предназначение концепции семантики.

Описание семантики является второй составной частью описания языка. Семантику иногда сводят к методу прямой интерпретации ЕЯ в некоторой модели [Логический98]. Другой метод состоит в переводе текстов ЕЯ на ФЯ и применении правил интерпретации ФЯ. С формальной точки зрения это правильно. Более того, развитие второго метода полностью используется в СеГ. Для ЕЯ семантика в большей части отсутствует, поэтому грамматика ЕЯ названа синтаксической. Для Интеллсист построена новая грамматика, которая названа семантической. СеГ сформулирована с помощью совокупности правил для вычисления смысла текстов. Исходным элементом СеГ является смысл термина или (самосмысл) лексемы, если она не является частью термина. Композициям терминов и лексем предписывается правило вычисления смысла. И так далее, рекурсивно определяется смысл всего текста до завершения вычислений смысла всего текста. Процесс вычисления смысла напоминает процесс вычисления значения формулы. При этом операциями выступают все термина всего текста, включая, например знаки препинания.