Смекни!
smekni.com

Методические рекомендации к изуче­нию курса для студентов отделения заочного обучения (стр. 4 из 7)

Изучение данной темы также требует ознакомления со структурой промежуточных и выходных документов АИС (АБС). Усвоить содержание этих вопросов студент сможет обратившись я источникам (4, с. 17, с. 135-1394 8, с. 18-20, с. 35-38; 35, 36). Более сложной для изучения является та часть раздела "информационное обеспечение", которая связана о организацией информационных массивов АИС (АБС) на машиночитаемых носителях. Вопросы выбора типа машиночитаемых носителей и способа кодирования информации на них излагаются в источниках (6, с. 27-28; с. 104-132). Наглядно классификация основных носителей информации, используемых в автоматизированных системах приводится в работе (8, с. 104). Также как я в тради­ционных информационно-поисковых системах (библиотеке) информационные массивы АИС (АБС) с целью уменьшения затрат на поиск ин­формации делятся на подмассивы, называемые специалистами вычислительной техники файлами, об организации информационных массивов АИС рекомендуется прочесть (7, с.250-295; 8, с.238-262520.- М.1977, с. 147-189 или М., 1970, с. 218-253; 21, с. 48-55).
В результате изучения указанных источников студент должен усво­ить технологию создания и ведения Файлов и баз паннах. Трудности усвоения этого материала будут уменьшены, воли студент хорошо знаком с организацией (структурированием информационных массивов) алфавитного, систематического, предметного и других библиотечных каталогов.

В составе лингвистического обеспечения АИС (АБС) функциони­руют как широко распространенные а библиотечной практике классификационные информационно-поисковые языки (ИПЯ) - УДК, ББК,МКИ и др,: так и предназначенные для организации автоматизированно­го поиска информации - дескрипторные ИПЯ, а также используемые при создании баз данных Рубрикаторы ГаСНТИ, МСНТИ и др. Каждый из них, имея свои положительные и отрицательнее стороны, (которые должны быть известны студенту из курсов "Библиотечные каталоги" и "Основы информатики" - раздел "Информационно-поисковые языки"), обеспечивают решение специфических задач. Студент должен хоро­шо знать структуру ИПЯ различных типов, требования к лексике ИПЯ, требования к лексической единице ИПЯ. Сведения о составе линг­вистического обеспечения автоматизированных систем рекомендуется рассмотреть не только в целом для них, но и в разрезе конкретных АИС (АБС) различных типов и уровней (35; 36). Особое внимание необ­ходимо уделить проблеме совместимости АИС (АБС) по лингвистичес­кому обеспечению и путям её решения. С вопросами лингвистического обеспечения АИС (АБС) студент, опираясь на базовую библиотечную - подготовку, может ознакомиться по работам (4, с.40-91; 10, с; 160-222; 2, с. 46-72; 20.-М., 1977, с. 18-67 или М., 1970, с.35-93).

Подсистема программного обеспечения АИС (АБС). Трудности, о которыми студент столкнется при изучении данного раздела темы, во многом связаны с расширением традиционных представлений- о способах записи информации. Как известно, любое сообщение на естественном языке может быть представлено в виде некоторое совокупности симво­лов, букв, цифр (например, советская литература, мощность электро­двигателя 15 квт, угол падения 25° и т.д.). На машинном языке эти сообщения будут записаны в виде некоторой комбинации нулей и еди­ниц (двоичных цифр или так называемых битов), что связано, с обеспе­чением простоты и надежности работы ЗИЛ.

Преобразование символов естественного языка в машиночитаемые коды регламентируется международными стандартами. В частности, для записи любой буквы латинского, греческого, кириллического алфавита, а также цифр используется международный код КОИ - 8 (см. Стан­дарт СЭВ 358 - 76). Число восемь обозначает, что любой символ пе­речисленных языков и цифр записывается в ячейках памяти ЭВМ вось­миразрядной комбинацией нуля и единицы. Процедура кодирования сим­волов естественного языка (букв, цифр) в восьмиразрядные коды и записи их на машиночитаемые носители осуществляется с помощью спе­циальных устройств подготовки данных. С представленной таким обра­зом информацией можно проводить логические и арифметические опера­ции. Но для того, чтобы ЭВМ могла производить данные операции, нужны определенные программы (инструкции), указывающие какие дейст­вия должна совестить ЭВМ с введенной в её память информацией. На­писание таких программ осуществляется на специальных алгоритмичес­ких языках. Среди эксплуатируемых алгоритмических языков (число которых по состоянию на 1.1.84г. составляло более трехсот), широ­кое применение нашли такие языки как ФОРТРАН, АЛКОЛ, АССЕМБЛЕР, Паскаль и другие. Как и естественные языки, каждый алгоритмический язык имеет свою лексику, семантику и синтаксис. Процесс разработки программ да ЭBM, называемый программированием включает несколько этапов, к которыми студент может ознакомиться по работе (3, с.156-162). Управление работой ЭВМ и решение на ней определенных задач требует наличия в составе программного обеспечения автоматизирован­ных систем широкого комплекса программ, подразделяемого на общее и специальное программное обеспечение. Основу специального програм­много обеспечения составляют пакеты, прикладных программ - ППП (оп­ределение см. 24, с. 20). Изучение раздела "программное обеспече­ние" АИС (АБС) - может бы осуществлено студентом по источникам (3, с. 155-162; 7, с. 178-189; 9, с.5-34; 20.-М., 1977, с.328-359; 21, с. 39-47, 77-101). При изучении данного материала прежде все­го следует усвоить общие принципы и способы представления информа­ции для обработки её в ЭВМ, ознакомиться со способами задания ал­горитмов решения информационных задач ЭВМ, а также блок-схемами алгоритмов решения задач поиска информации, статистической об­работки данных и других , уяснить не только структуру и назначение основных групп программ, но и предъявляемые к ним требования (сов­местимости, модульности, гибкости).

Знакомясь с техническим обеспечением АИС (АБС), необходимо усвоить назначение, состав и требования к основным группам эксплуатируемых в них технических средств, перечень которых определяется реализуемыми в системе технологическими процессами. С характерис­тиками комплекса технических средств АИС (АБС), в том числе ЭВМ, средств подготовки промежуточных носителей информации, средств ввода и вывода информации, средств копирования и тиражного размно­жения документов, средств микрофильмирования и фотонабора, а так­же средств использования микроносителей, студент сможет ознакомить­ся по источникам (3; 6).

При работе с источником (3) студенту рекомендуется, прежде все­го, изучить раздел "Классификация технических средств", изложенный на в, Т4-Т6 данного источника. А при работе со справочником (6) особое внимание рекомендуется обратить на раздел 8-1 "Классифи­кация средств вычислительной техники" (6, с. 243-265), а также на материал, освещающий вопросы классификации технических средств по каждому из разделов 1-8 данного справочника. Кроме того при оз­накомлении с техническими средствами АИС (АБС) следует использовать материалы курса "Технические средства библиотечной работы".

Контрольные вопросы:

1. Назовите все обеспечивающие подсистемы автоматизированных ин­формационных и библиотечных систем.

2.Охарактеризуйте входные и выходные документы всесоюзных, центральных отраслевых, республиканских, межотраслевых территориальных, местных (локальных АИС).

3. Пользуясь ГОСТом 7.19-79, отберите фиксируемые на магнитной ленте
обязательные элементы данных для книг, сериальных издании, дис­сертаций и укажите их метки.

4. Перечислите информационно-поисковые языки, входящие в состав лин­гвистического обеспечения АИС (АВС).

5. Чем обусловлено использование в АИС (АБС) нескольких ИПЯ?

6. Как реализуется совместимость АИС (АБС) по лингвистическому обеспечению?

7. Пользуясь стандартным кодом КОИ-8, закодируйте слова "система", "библиотека", число 125.

8. Дайте определение и характеризуйте состав общего и специального программного обеспечения АИС (АБС).

9. Перечислите группы технических средств, входящих в комплекс технического обеспечения АИС (АБС).

10. Чем определяются параметр»» технических средств конкретной АИС (АБС)?

Тема (23) Основные проблемы автоматизации семантических процессов обработки информации

Основные вопросы:

1. Объективные предпосылки и проблемы автоматизации семантических процессов обработки информации.

2. Основные подходы к решению проблемы автоматизации индексирова­ния, реферирования, систематизации источников информации, на­учного перевода.

3. Отечественные и зарубежные достижения в области автоматизации семантических процессов обработки информации.

Все реализуемые в библиотеке (службе информации) технологи­ческие процессы и операции можно разделить на две группы (3, с. 10-11). К первой группе следует отнести такие технологические процессы и операции, "при выполнении которых весьма незначительно используется интеллектуальный труд; а ко второй - требующие от библиотечных и информационных работников высокого уровня интеллек­та. К технологическим процессам второю типа, которые называют систематическими, можно отнести индексирование, аннотирование, рефе­рирование документов, предметизацию, систематизацию, научный пере­вод. По своей трудоемкости они занимают ведущее место в библиотечной и информационной практике. Наряду со снижением трудоемкости выполнения таких технологических процессов и операций (непрерывно увеличивающейся в связи с возрастанием объемов документальных потоков) потребность в их автоматизация в значительней степени определяется проблемой неоднозначности (субъективности) раскрытия содержания и свертывания текстов первичных документов, проявляю­щейся при семантической обработке. Трудности такого рода должны быть хорошо известны студенту - заочнику, работающему в библиоте­ке» Возможности преодоления этих трудностей появились у библиотек и служб информации с созданием в последние годы новых вычислитель­ных комплексов (ЭВМ). Разработчиками автоматизации процессов се­мантической обработки информации предложено несколько подходов ре­шения данной проблемы. В частности, используя быстродействующую ЭВМ, можно относительно легко подсчитать частоту встречаемости слов в документе, позволяющую судить о значимости тех или иных слов (или групп слов) в тексте документа. Другой подход связан о подсчетом частоты встречаемости в документе одних слов о другими и выявлени­ем таким образом бинарных (ассоциативных) связей между ними. Тре­тий подход предусматривает поручение ЭШ распознавания в тексте документа таких частей, которые считаются наиболее информативно нагруженными. Такое распознавание обычно осуществляется через под­счет частоты повторения в тексте документа слов - штампов (маркеров) М, наконец, существуют более сложные подходы, связанные с разработ­кой строгого порядка разделения текстов документов на фрагменты (предложения) с последующим анализом их конструкции и выделением тех лексических; единиц, которые передают сущность его содержания. В зависимости от вида семантического процессов ЭВМ производит с вы­деленными из текста документов лексическими единицами или фрагмен­тами соответствующие операции. Так, при автоматическом индексирова­нии ЭВМ производит с помощью машинных словарей присвоение им индек­сов ИПЯ, при систематизации - упорядоченное, распределение по сход­ству присущих им признаков, при реферировании и аннотировании - комбинирование во вторичный документ, при машинном, переводе - мор­фологический, синтаксический и семантический анализ и синтез. От­веты на вопросы программы по данной теме студент сможет найти во многих публикациях, но в большей степени рекомендуется ознакомить­ся о содержанием источников (17, с. 5-37; 20.- М., 1970, с. 94-138; 21, с 68-76; 4, с. 121 - 128). Определение ключевых терминов темы: "Автоматическая классификация", "Автоматический анализ текста", "Автоматический перевод", "Автоматический синтез текста", "автома­тическое индексирование", "Автоматическое реферирование", а также термина "Машинный словарь" приводится в ГОСТе (24, с. 29-30).