Предметная запись - это слово, словосочетание, фраза, которая уточняет предметный заголовок или подзаголовок. Предметная запись может обозначать как предметный подзаголовок, так и класс предметов на другом уровне иерархии.
Предметная рубрика - это совокупность предметного заголовка, подзаголовка и записи с указанием адреса или места хранения документа. Между предметными заголовками, подзаголовками в АПК указываются синонимические, родо-видовые и ассоциативные отношения. К ассоциативным отношениям отнесены отношения вида: «часть-целое» «процесс-орудие», «процесс-материал», «материал-изделие» и др. Все виды отношений в АПК имеют свои пометы: синонимии «см.» (смотри); родо-видовые отношения между предметными заголовками фиксируются пометами «см.» (смотри) и "см. также"; парадигматические отношения между заголовками и входящими в них подзаголовками указывают путем сдвига подзаголовка на два знака вправо относительно заголовка; ассоциативные отношения имеют пометку «см. также».
Фасетные классификации. Среди существующих информационно-поисковых языков особое место занимают фасетная или аналитико-синтетическая классификация. Этот вид классификации был предложен Ш.Р. Ранганатоном - «Классификация с двоеточием». Сущность метода разработки фасетных классификаций состоит в том, что на основе анализа отрасли знания, техники, документов выделяют такие категории классов предметов, которые применяются в данной отрасли. Перечень категорий (классов предметов) называют фасетами. Выделенные из документов термины, научные понятия распределяются по фасетам, в которых могут образовываться субфасеты. Термин, понятие, вошедший в субфасету, называют фокусом. Каждый фасет обозначается буквой, а субфасет - буквой фасета, а также номером.
Методика индексирования документов с использованием фасетной классификации сводится к тому, что в результате анализа документа выделяют главную тему или предмет, которым присваивается буква фасета. Для детального описания предмета из фасета берут столько фокусов, сколько их необходимо для полного и многоаспектного раскрытия содержания. Использование фасетной классификации имеет ряд преимуществ перед иерархическими, классификациями. Фасетные классификации позволяют собирать в одном месте информационного массива все документы по предмету (теме), которые заиндексированы с учетом всего многообразия аспектов предмета.
Таким образом, фасетные классификации позволяют одновременно осуществлять многоаспектный поиск информации. Несмотря на значительные преимущества данной классификации перед иерархическими, фасетные классификации не нашли широкого распространения, потому что этот вид классификации обслуживает массивы документов по узким тематическим, в лучшем случае, отраслевым направлениям.
Рубрикатор государственной автоматизированной системы научно-технической информации - (ГАСНТИ). Национальные рубрикаторы разрабатываются в соответствии с «Положением о лингвистическом обеспечении национальных систем НТИ» и нормативно-техническими предписаниями Международного центра научно-технической информации (МЦНТИ 7-75).
Нормативно-методические документы о лингвистическом обеспечении определяют не только разработку, но и эксплуатацию лингвистического обеспечения, а также автоматизированную систему ведения информационно-поисковых языков, обеспечивающих справочно-информационное обслуживание сведениями о лингвистических средствах и поддержке их ядра в рабочем состоянии с учетом изменения во времени.
Ядро лингвистического обеспечения кроме рубрикатора включает базисные тезаурусы, перечни грамматических средств ИПЯ, а также таблицы соответствия рубрикатора с информационными классификациями, используемыми в системе НТИ. Рубрикатор ГАСНТИ является важнейшим классификационным языком в комплексе лингвистического обеспечения в автоматизированных системах НТИ.
Основное назначение рубрикатора ГАСНТИ - разделение информационного потока на подмассивы, формирование справочно-информационных массивов на базе использования вычислительной техники, отражение наиболее важных аспектов документов и запросов.
Исходя из общих принципов рубрикации (индексирования) документов многофункционального назначения рубрикатора, который используется для формирования документальных фондов и информационных массивов, необходимо чтобы каждый документ, представляющий потенциальный интерес с разных точек зрения, содержал в рубрикаторе соответствующие коды рубрик.
Таким образом, в каждом разделе рубрикатора присутствуют типовые коды рубрик. Как правило, список рубрик в рубрикаторе, описывающих содержание документов и запросов, значительно шире списка рубрик, используемых для индексирования документов.
Каждый документ, который проходит семантическую обработку в соответствующих всероссийских центрах информации, обязательно получает код или группу кодов рубрикатора. На государственные центры научно-технической информации возложена ответственность за централизованное индексирование информационных документов, которые обрабатываются в них с использованием Рубрикатора.
В международных, специализированных и отраслевых автоматизированных информационных системах используется целый комплекс информационно-поисковых языков.
Классификатор государственных стандартов (КГС). Входит в состав лингвистического обеспечения информационных систем и принадлежит к одной из разновидностей информационно-поисковых языков иерархического типа. Структура КГС включает собственно классификатор, предметный указатель, списки действующих государственных стандартов, технических условий на аттестованную продукцию, а также действующих и утвержденных ГОСТов. Классификатор представлен списком основных делений с их индексами, а также списком классов и групп. Каждый раздел КГС разделен на классы. Раздел обозначается буквами, а классы арабскими цифрами, от нуля до девяти. Классы делят на группы и обозначают составным индексом раздела, класса и группы. Поиск стандартов в информационном массиве может осуществляться по номеру, по разделу, по классу и группе.
Информационно-поисковые языки дескрипторного типа. В конце 60-х гг. получили широкое распространение информационно-поисковые языки дескрипторного типа. В основу построения дескрипторных ИПЯ положен принцип координатного индексирования, который заключается в том, что центральная тема документа, запроса выражается в виде некоторого перечня множества слов и словосочетаний естественного языка, обычно являющихся именами простых классов (предметов, процессов, явлений). Такие слова и словосочетания, которые выделены из текста документов, запросов являются как бы координатами в некотором N-мерном пространстве предметно-тематических признаков. Когда в поисковом предписании перечисляются слова и словосочетания, которые должны содержаться в поисковых образах поисковых документов, то как бы указываются координаты этих документов в данном N-мерном пространстве предметно-тематических признаков,
ИПЯ дескрипторного типа позволяют обеспечить глубину и полноту индексирования документов и тем самым осуществлять поиск не только пертинентных (полезных), но и релевантных документов, хранящихся в информационных массивах.
В словарный состав дескрипторного языка включается терминология не только отраслевая, но и терминология других тематических направлений. Формирование массива лексических единиц словаря проводится методом свободного индексирования документов и запросов. Отобранная терминология из документов и запросов дополняется терминами из тезаурусов научно-технических терминов, классификационных таблиц УДК, ББК, справочников, учебников и др. Выделенные термины, научные понятия являются основой для разработки терминологических систем, которые служат созданию лексико-семантического перечня Дескрипторов и недескрипторов; систематического указателя дескрипторных областей и групп; перечню дескрипторов по группам.
Основным достоинством дескрипторных языков является то, что они позволяют проводить эффективный поиск по любому, заранее не предусмотренному сочетанию признаков, кроме того, дескрипторные ИПЯ позволяют легко вводить новые термины и учитывать новые информационные потребности. Дескрипторные ИПЯ обычно имеют небольшой по объему словарный состав. К недостаткам таких ИПЯ можно отнести:
• трудности, связанные с проведением информационного поиска по тематическим запросам;
• создание ИПЯ дескрипторного типа является трудоемким делом;
• применение ИПЯ требует специальных навыков.
Отраслевые, местные службы информации формируют свои справочно-информационные фонды не только по основному профилю, но и родственным, смежным отраслям науки и техники. Для обслуживания такой коллекции документов от ИПЯ требуется универсальность. ИПЯ дескрипторного типа такой универсальностью не обладают.
Структура ИПЯ: дескрипторная статья, дескрипторная группа, дескрипторное поле, дескрипторная область.
Дескрипторная статья включает заглавный дескриптор, синонимы, родовые дескрипторы, видовые дескрипторы, ассоциативные дескрипторы, аскрипторы.
Дескрипторную группу образуют лексические единицы - дескрипторы, объединенные в тематический подкласс.
Дескрипторное поле образуют дескрипторные области, т. е. области науки и техники.
По наполняемости дескрипторами дескрипторных групп, полей и областей можно судить об эффективности обслуживания ИПЯ дескрипторного типа коллекции документов.