Коэффициент полноты (Р) определяют по формуле
Р =. 100,
где Р - число релевантных документов, найденных в процессе
поиска по данному запросу,
С - общее число документов в системе, о которых известно, что они релевантны определенному запросу.
Коэффициент точности поиска (Т) определяют по формуле
Т =. 100,
где Р - число релевантных документов, найденных при поиске по определенному запросу;
- общее число документов, выданных при поиске по определенному запросу
Кроме общих требований к проектированию АБС, обязательными документами к техническому заданию на проектирование кроме ТЭО должны прилагаться отдельно требования к информационному, лингвистическому, программному, техническому, организационному обеспечению АБС.
Общие требования к содержанию документов по информационному обеспечению регламентируются ГОСТом 24.205-80.
Принцип организации информационного обеспечения и требования к содержанию документов изложены в ГОСТе и определяются составом, структурой входного и выходного потоков документов, обоснованно выбранным носителем информации, на котором фиксируется запись, а также применяемыми метода- . ми контроля за подготовкой баз данных.
В раздел “Принципы организации информационного обеспечения" включают описания информационных массивов собственно создаваемых АБС, а также описания информационных массивов, получаемых в порядке взаимного обмена или же приобретаемых по подписке, которые планируется адаптировать в системе.
В разделе "Состав и структура информационной базы" должен быть приведен перечень всех баз данных, которые будут эксплуатироваться АБС. Для каждой базы данных должны быть описаны логическая структура базы данных, тип базы данных (библиографическое описание; БО + ключевые слова, БО + реферат), виды документов, включаемых в базу данных, перечень как обязательных, так и факультативных элементов данных с указанием их общего количества, система классификации, используемая для идентификации документов (УДК, ББК, МКИ, Рубрикатор ГАСНТИ и т.п.), наличие ссылочного аппарата и поискового образа.
В характеристике базы данных должен быть указан информационно—поисковый язык, с помощью которого осуществляется индексирование документов, а также сведения о кодировании символов (алфавита), методах и плотности записи, условия поставки баз данных, виды справочно-информационного обслуживания, в которых может быть использована эта база данных; список пакетов прикладных программ, с помощью которых осуществляются процедуры с базами данных. И, наконец, дается тип магнитной ленты, на которой записываются информация, и модель ЭВМ, реализующей систему.
описывая входной документальный поток, необходимо разделить его на виды:
а) разовые издания (книги), не относящиеся к видам перечисленным в пунктах в, ж;
б) сериальные издания, также не относящиеся к перечисленным в пунктах в, ж;
в) отчеты в научно-исследовательских работах;
г) диссертации;
д) патентные документы;
е) нормативно-технические документы;
ж) фирменные издания.
В общей характеристике базы данных должна быть приведена её тематика. Тематику эту можно представлять в виде набора кодов тематико-типологического плана формирования документальных фондов, задаваемых шифрами (индексами) принятых систем классификации, которые используются для формирования и организации информационных массивов АБС. В качестве характеристики базы данных должен быть приведен перечень обязательных и. факультативных элементов баз данных для каждого вида документов в соответствии с ГОСТом 7.19-79 или нормативно-техническим предписанием МЦНТИ "Структура записи для обмена библиографической информацией на магнитной ленте" (НТП МЦНТИ 1 - 82). Кроме перечня элементов описания, указывают их количество для каждого вида индексируемых документов, а также перечисляют схемы классификации (МКИ, ББК, УДК, Рубрикатор ГАСНТИ, классификаторы и т.д.), которые используют в базах данных для систематизации информационных подмассивов.
Для баз данных не менее важное значение имеет указание на наличие ссылочного аппарата, например, адреса хранителя микрофиши, первичного документа. Обычно для поискового образа указывают наличие дескрипторов, ключевых слов, как правило, указывают среднее их число на документ. Для повышения результативности информационного поиска при индексировании документов используют указатели роли связи, а также логические множители. И поэтому в характеристике баз данных целесообразно указать используемые грамматические средства.
Система кодирования символов (алфавит), методы и плотность записи на магнитной ленте позволяют, судить о возможности адаптации баз данных в АБС и поэтому считается целесообразным включение, и этих сведений. Немаловажное значение имеют объем, периодичность выпуска, а также формат и режимы поставки баз данных. При этом важно и указание на виды справочно-информационного обслуживания, которые могут быть организованы на базе данных (ИРИ, РП, РЖ, СИ, ДОР и т.д.). Известно, что проблемы совместимости в АБС реализуют через математическое обеспечение модели ЭВМ, типы накопителей данных. Поэтому перечисленные выше характеристики являются обязательными.
В проектируемой АБС регионального значения ориентируются на эксплуатацию баз данных, которые генерируют всесоюзные, центральные отраслевые, а также региональные информационные и библиотечные центры. Но бывают случаи, и нередко, когда базы данных готовят в автономных АБС. В этих случаях учитывают особенность функционирования АБС и эксплуатации баз данных. Поэтому к информационному обеспечению по разделу "Внемашинные информационные базы" приводится перечень документов, информационных сообщений, которые планируются для ввода в информационный массив АБС и требуют предварительной предмашинной обработки. В этом случае процедуру предмашинной обработки называют составлением-заполнением предмашинного рабочего листа,
В требованиях по информационному обеспечению предусматривается полное описание процессов сбора, обработки, хранения данных с указанием последовательности выполнения не только предмашинной, но и машинной обработки, включая операции по контролю заполнения ПРЛ, перфорированию (записи данных на носителе), выполненных с помощью, технических средств.
Существуют различные способы размещения и записи информации. Например, в логической схеме баз данных можно использовать иерархическую структуру, представляющую собой совокупность записей (данных), в которой каждая запись связана не более чем с одной записью более высокого уровня. Например, по Рубрикатору ГАСНТИ тематическая рубрика 00.01 - "Основоположники марксизма-ленинизма" связана со всей родовой (вышестоящей) тематической рубрикой ОО - 'общественные науки"; или тематическая рубрика 18,09— "история искусств" — с родовой рубрикой 18 - "искусство. Искусствоведение" и т.д.
В отличие от иерархической схемы расположения записей существует так называемая сетевая структура, в которой любая запись может быть связана с произвольным количеством других записей, находящихся на любом уровне иерархии. Например, в записях, представляющих собой таблицу.
Кроме перечисленных схем баз данных (иерархической и сетевой), используются реляционные логические схемы, в которых структура баз данных представляет собой совокупность таблиц, отношений, каждое из которых есть несвязная совокупность записей одного типа (например авторский указатель, предметный указатель, указатель источников). В любом случае структура базы данных должна обеспечивать совместное использование данных с минимальным временем обращения к базе данных, с приемлемым информационным шумом (избыточностью), с минимальным объемом памяти ЭВМ.
Для удовлетворения все возрастающих потребностей на библиографическую и фактографическую информацию совершенно естественными будут такие условия, при которых АБС будет располагать значительным набором баз данных, призванных служить для удовлетворения как тематических библиографических, так и фактографических запросов.
Таким образом, совокупность баз данных, на которых осуществляется комплексное информационное, справочно-библиографическое и библиотечное обслуживание, принято называть в АБС банком данных. На организацию и поддержание в рабочем состоянии банка данных распространяются требования ГОСТа 14,413-80 (Банк данных технологического назначения. Общие требования).
Требования к лингвистическом обеспечению АБС, В методических указаниях о требованиях к содержанию и составлению технического задания на создание автоматизированных систем центра данных ГСССД РД 50-300-82 под лингвистическим обеспечением понимается система взаимосвязанных или совместно эксплуатируемых информационно-поисковых языков, предназначенных, для индексирования документов, составления поисковых предписаний, организации распределенных баз данных, а также систематизации информационных массивов. То множество информационно—поисковых языков, которые могут быть использованы и используются в АБС, объясняется тем, что каждый из применяемых ИПЯ обслуживает решение определенных задач и выполняет различные функции, связанные с индексированием документов и запросов, поиском информации, организацией информационных изданий типа РЖ, СИ, летописей. Поэтому выбор информационно-поисковых языков, в качестве лингвистического обеспечения АБС должен строиться на глубоком детальном анализе тех информационных задач и объектов, которые подлежат автоматизации. Заметим, что разработка универсальных ИПЯ для решения множества информационных задач неприемлема, И не только потому, что разработка ИПЯ - дорогостоящий процесс, но и потому, что задачи, решаемые в АБС, принадлежат к различным видам и требуют специфических лингвистических средств. В качестве показателей и критериев оценки информационно-поисковых языков должны быть оценки по семантической силе, однозначности, компактности, небольшой стоимости, а также простоте овладения методами индексирования документов и запросов.