Изучение данной темы также требует ознакомления со структурой промежуточных и выходных документов АИС (АБС). Усвоить содержание этих вопросов студент сможет обратившись я источникам (4, с. 17, с. 135-1394 8, с. 18-20, с. 35-38; 35, 36). Более сложной для изучения является та часть раздела "информационное обеспечение", которая связана о организацией информационных массивов АИС (АБС) на машиночитаемых носителях. Вопросы выбора типа машиночитаемых носителей и способа кодирования информации на них излагаются в источниках (6, с. 27-28; с. 104-132). Наглядно классификация основных носителей информации, используемых в автоматизированных системах приводится в работе (8, с. 104). Также как я в традиционных информационно-поисковых системах (библиотеке) информационные массивы АИС (АБС) с целью уменьшения затрат на поиск информации делятся на подмассивы, называемые специалистами вычислительной техники файлами, об организации информационных массивов АИС рекомендуется прочесть (7, с.250-295; 8, с.238-262520.- М.1977, с. 147-189 или М., 1970, с. 218-253; 21, с. 48-55).
В результате изучения указанных источников студент должен усвоить технологию создания и ведения Файлов и баз паннах. Трудности усвоения этого материала будут уменьшены, воли студент хорошо знаком с организацией (структурированием информационных массивов) алфавитного, систематического, предметного и других библиотечных каталогов.
В составе лингвистического обеспечения АИС (АБС) функционируют как широко распространенные а библиотечной практике классификационные информационно-поисковые языки (ИПЯ) - УДК, ББК,МКИ и др,: так и предназначенные для организации автоматизированного поиска информации - дескрипторные ИПЯ, а также используемые при создании баз данных Рубрикаторы ГаСНТИ, МСНТИ и др. Каждый из них, имея свои положительные и отрицательнее стороны, (которые должны быть известны студенту из курсов "Библиотечные каталоги" и "Основы информатики" - раздел "Информационно-поисковые языки"), обеспечивают решение специфических задач. Студент должен хорошо знать структуру ИПЯ различных типов, требования к лексике ИПЯ, требования к лексической единице ИПЯ. Сведения о составе лингвистического обеспечения автоматизированных систем рекомендуется рассмотреть не только в целом для них, но и в разрезе конкретных АИС (АБС) различных типов и уровней (35; 36). Особое внимание необходимо уделить проблеме совместимости АИС (АБС) по лингвистическому обеспечению и путям её решения. С вопросами лингвистического обеспечения АИС (АБС) студент, опираясь на базовую библиотечную - подготовку, может ознакомиться по работам (4, с.40-91; 10, с; 160-222; 2, с. 46-72; 20.-М., 1977, с. 18-67 или М., 1970, с.35-93).
Подсистема программного обеспечения АИС (АБС). Трудности, о которыми студент столкнется при изучении данного раздела темы, во многом связаны с расширением традиционных представлений- о способах записи информации. Как известно, любое сообщение на естественном языке может быть представлено в виде некоторое совокупности символов, букв, цифр (например, советская литература, мощность электродвигателя 15 квт, угол падения 25° и т.д.). На машинном языке эти сообщения будут записаны в виде некоторой комбинации нулей и единиц (двоичных цифр или так называемых битов), что связано, с обеспечением простоты и надежности работы ЗИЛ.
Преобразование символов естественного языка в машиночитаемые коды регламентируется международными стандартами. В частности, для записи любой буквы латинского, греческого, кириллического алфавита, а также цифр используется международный код КОИ - 8 (см. Стандарт СЭВ 358 - 76). Число восемь обозначает, что любой символ перечисленных языков и цифр записывается в ячейках памяти ЭВМ восьмиразрядной комбинацией нуля и единицы. Процедура кодирования символов естественного языка (букв, цифр) в восьмиразрядные коды и записи их на машиночитаемые носители осуществляется с помощью специальных устройств подготовки данных. С представленной таким образом информацией можно проводить логические и арифметические операции. Но для того, чтобы ЭВМ могла производить данные операции, нужны определенные программы (инструкции), указывающие какие действия должна совестить ЭВМ с введенной в её память информацией. Написание таких программ осуществляется на специальных алгоритмических языках. Среди эксплуатируемых алгоритмических языков (число которых по состоянию на 1.1.84г. составляло более трехсот), широкое применение нашли такие языки как ФОРТРАН, АЛКОЛ, АССЕМБЛЕР, Паскаль и другие. Как и естественные языки, каждый алгоритмический язык имеет свою лексику, семантику и синтаксис. Процесс разработки программ да ЭBM, называемый программированием включает несколько этапов, к которыми студент может ознакомиться по работе (3, с.156-162). Управление работой ЭВМ и решение на ней определенных задач требует наличия в составе программного обеспечения автоматизированных систем широкого комплекса программ, подразделяемого на общее и специальное программное обеспечение. Основу специального программного обеспечения составляют пакеты, прикладных программ - ППП (определение см. 24, с. 20). Изучение раздела "программное обеспечение" АИС (АБС) - может бы осуществлено студентом по источникам (3, с. 155-162; 7, с. 178-189; 9, с.5-34; 20.-М., 1977, с.328-359; 21, с. 39-47, 77-101). При изучении данного материала прежде всего следует усвоить общие принципы и способы представления информации для обработки её в ЭВМ, ознакомиться со способами задания алгоритмов решения информационных задач ЭВМ, а также блок-схемами алгоритмов решения задач поиска информации, статистической обработки данных и других , уяснить не только структуру и назначение основных групп программ, но и предъявляемые к ним требования (совместимости, модульности, гибкости).
Знакомясь с техническим обеспечением АИС (АБС), необходимо усвоить назначение, состав и требования к основным группам эксплуатируемых в них технических средств, перечень которых определяется реализуемыми в системе технологическими процессами. С характеристиками комплекса технических средств АИС (АБС), в том числе ЭВМ, средств подготовки промежуточных носителей информации, средств ввода и вывода информации, средств копирования и тиражного размножения документов, средств микрофильмирования и фотонабора, а также средств использования микроносителей, студент сможет ознакомиться по источникам (3; 6).
При работе с источником (3) студенту рекомендуется, прежде всего, изучить раздел "Классификация технических средств", изложенный на в, Т4-Т6 данного источника. А при работе со справочником (6) особое внимание рекомендуется обратить на раздел 8-1 "Классификация средств вычислительной техники" (6, с. 243-265), а также на материал, освещающий вопросы классификации технических средств по каждому из разделов 1-8 данного справочника. Кроме того при ознакомлении с техническими средствами АИС (АБС) следует использовать материалы курса "Технические средства библиотечной работы".
Контрольные вопросы:
1. Назовите все обеспечивающие подсистемы автоматизированных информационных и библиотечных систем.
2.Охарактеризуйте входные и выходные документы всесоюзных, центральных отраслевых, республиканских, межотраслевых территориальных, местных (локальных АИС).
3. Пользуясь ГОСТом 7.19-79, отберите фиксируемые на магнитной ленте
обязательные элементы данных для книг, сериальных издании, диссертаций и укажите их метки.
4. Перечислите информационно-поисковые языки, входящие в состав лингвистического обеспечения АИС (АВС).
5. Чем обусловлено использование в АИС (АБС) нескольких ИПЯ?
6. Как реализуется совместимость АИС (АБС) по лингвистическому обеспечению?
7. Пользуясь стандартным кодом КОИ-8, закодируйте слова "система", "библиотека", число 125.
8. Дайте определение и характеризуйте состав общего и специального программного обеспечения АИС (АБС).
9. Перечислите группы технических средств, входящих в комплекс технического обеспечения АИС (АБС).
10. Чем определяются параметр»» технических средств конкретной АИС (АБС)?
Тема (23) Основные проблемы автоматизации семантических процессов обработки информации
Основные вопросы:
1. Объективные предпосылки и проблемы автоматизации семантических процессов обработки информации.
2. Основные подходы к решению проблемы автоматизации индексирования, реферирования, систематизации источников информации, научного перевода.
3. Отечественные и зарубежные достижения в области автоматизации семантических процессов обработки информации.
Все реализуемые в библиотеке (службе информации) технологические процессы и операции можно разделить на две группы (3, с. 10-11). К первой группе следует отнести такие технологические процессы и операции, "при выполнении которых весьма незначительно используется интеллектуальный труд; а ко второй - требующие от библиотечных и информационных работников высокого уровня интеллекта. К технологическим процессам второю типа, которые называют систематическими, можно отнести индексирование, аннотирование, реферирование документов, предметизацию, систематизацию, научный перевод. По своей трудоемкости они занимают ведущее место в библиотечной и информационной практике. Наряду со снижением трудоемкости выполнения таких технологических процессов и операций (непрерывно увеличивающейся в связи с возрастанием объемов документальных потоков) потребность в их автоматизация в значительней степени определяется проблемой неоднозначности (субъективности) раскрытия содержания и свертывания текстов первичных документов, проявляющейся при семантической обработке. Трудности такого рода должны быть хорошо известны студенту - заочнику, работающему в библиотеке» Возможности преодоления этих трудностей появились у библиотек и служб информации с созданием в последние годы новых вычислительных комплексов (ЭВМ). Разработчиками автоматизации процессов семантической обработки информации предложено несколько подходов решения данной проблемы. В частности, используя быстродействующую ЭВМ, можно относительно легко подсчитать частоту встречаемости слов в документе, позволяющую судить о значимости тех или иных слов (или групп слов) в тексте документа. Другой подход связан о подсчетом частоты встречаемости в документе одних слов о другими и выявлением таким образом бинарных (ассоциативных) связей между ними. Третий подход предусматривает поручение ЭШ распознавания в тексте документа таких частей, которые считаются наиболее информативно нагруженными. Такое распознавание обычно осуществляется через подсчет частоты повторения в тексте документа слов - штампов (маркеров) М, наконец, существуют более сложные подходы, связанные с разработкой строгого порядка разделения текстов документов на фрагменты (предложения) с последующим анализом их конструкции и выделением тех лексических; единиц, которые передают сущность его содержания. В зависимости от вида семантического процессов ЭВМ производит с выделенными из текста документов лексическими единицами или фрагментами соответствующие операции. Так, при автоматическом индексировании ЭВМ производит с помощью машинных словарей присвоение им индексов ИПЯ, при систематизации - упорядоченное, распределение по сходству присущих им признаков, при реферировании и аннотировании - комбинирование во вторичный документ, при машинном, переводе - морфологический, синтаксический и семантический анализ и синтез. Ответы на вопросы программы по данной теме студент сможет найти во многих публикациях, но в большей степени рекомендуется ознакомиться о содержанием источников (17, с. 5-37; 20.- М., 1970, с. 94-138; 21, с 68-76; 4, с. 121 - 128). Определение ключевых терминов темы: "Автоматическая классификация", "Автоматический анализ текста", "Автоматический перевод", "Автоматический синтез текста", "автоматическое индексирование", "Автоматическое реферирование", а также термина "Машинный словарь" приводится в ГОСТе (24, с. 29-30).