Магн. лента (МЛ) – примен. в ЭВМ с 50-х гг., когда уже МЛ примен-ся в звукозаписи, в измерит. технике. МЛ пр.соб. гибкую подложку в виде ленты, на кот. нанесено магн. МЛ имеют выс. надежность хран-я инф-ции. Оптич. диск – создан в нач. 70-х гг. и в 1983 удалось предложить работо-способные образцы НОД.
4. Лингвистическое обеспечение ИС.
ГОСТ 24.00-84 АСУ. Основные термины и определения.
ЛО – комплекс языковых средств информации в виде данных.
Функции ЛО – формализованное представление обеспеченности доступа к информационным средством к подготовке информационных продуктов и услуг.
Решение:
1. моделирование понимания текста;
2. синтез речи;
3. переход от формализованного представления содержания речи на естественный язык.
Эти 2 вопроса в первую очередь решаются при разработке прикладных задач (ввод текста, обнаружение ошибок, автоматическом переводе с одного языка на другой, при кодировании и классификации, составлении рефератов). Успех зависит тот полноты и качества языковых средств.
При этом ЛО разделяется на следующие части:
1. декларативная – единицы языка, различные грамматические тексты (языковые единицы – отдельные слова/сочетания, приставка, корень, суффикс – вся значимая часть слова);
2. процедурная – средства манипулирования единицами языка:
- морфологический анализ (анализ слов/сочетаний);
- семантический анализ (смысловой анализ);
- синтаксический (построение предложений).*, ВИНИТИ – словарь, содержащий информацию научно-технической документации и общественно-политического содержания. Было обработано свыше 80 млн. книг.
Основное средство - Языковые средства, должны:
- подбираться в соответствии с решаемыми задачами,
- быть простыми и отличаться гибкостью, чтобы их можно было можно использовать в комплексе.
ЛС предметной области – термин – слово/сочетание точно обозначающее конкретное понятие (форма фиксации знания).
Термин в качестве ЛС – как особая подсистема языка. Использование терминов позволяет:
конкретно выделить и очертить границы;
отслеживать развитие конкретного знания в конкретной области;
показывает динамику развития знания;
очертить структуру научного знания;
выделить связи и все интегрированные процессы в структуре научного знания.
Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.
Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.
Методика Т.А. опирается на приемы прикладной лингвистики:
1. Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);
2. Семантические поля – отдельные разделы, подразделы;
3. Класс условной эквивалентности – анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.
Самые сложные процедуры:
установление родовидовых отношений;
- установление ключевых слов.
В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше «шума».
5. Термин – лексическое средство описания предметной области.
Термин в качестве ЛС – как особая подсистема языка. Использование терминов позволяет:
конкретно выделить и очертить границы;
отслеживать развитие конкретного знания в конкретной области;
показывает динамику развития знания;
очертить структуру научного знания;
выделить связи и все интегрированные процессы в структуре научного знания.
Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.
Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.
Методика Т.А. опирается на приемы прикладной лингвистики:
4. Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);
5. Семантические поля – отдельные разделы, подразделы;
6. Класс условной эквивалентности – анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.
Самые сложные процедуры:
установление родовидовых отношений;
- установление ключевых слов.
В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше «шума».
6. Информационно-поисковый тезаурус.
При разработке ИПТ применяется ГОСТ 7.25-80 «Тезаурус информационно-поисковый одноязычный», ГОСТ 7.14-80 «-/- многоязычный». ИПТ представляет собой обычный словарь слов/сочетаний – отраслевой словарь. Тезаурус от лат. – хранилище, клад.
13 в. – составление книг о сокровищах.
17-18 вв. – словари-справочники при составлении служебных дисциплин.
1950 гг. С развитием машинного перевода (совр. тезаурус).
Тезаурус имеет узко прикладное назначение – обработка информационных запросов.*, информатика – Шрейдер, Гольштейн, Брониславский.
Методика составления тезаурусов:
1. предметная выборка всех ключевых слов конкретной предметной области;
2. определение всех взаимосвязей между отдельными терминами.
Сама предметная область м.б. задана как аксиома (область естественных знаний: математика, химия, физика).
3. уточнение предметной области;
4. анализ всего массива документов (насколько точна предметная область);
5. разработка всех взаимосвязей;
6. весь набор терминов на экспертизу спецов-аналитиков для которых разрабатывается тезаурус.
Вся стадия разработки ИПТ выполняется совместными усилиями спецов различных профессий: спец. ПК, спец. конкретной области.
Требования при разработке тезауруса:
1. массив документов д.б. достаточно однородным;
2. ограниченное число авторов (устранение разнобоя профессиональной лексики);
3. весь массив документов д.б. в машиночитаемом формате.
7. Классификаторы. Языки формализованного описания данных.
Классификаторы – нормативные документы, которые содержат систематический перечень объектов и присвоенные им коды. Классификации и кодированию принадлежат все социальные и экономические объекты. Информация, содержащаяся в этих классификаторах технико-экономическая и социальная информация, служит для информационного обеспечения в следующих областях:
экономика;
статистика;
таможенное дело.
Разработано свыше 37 классификаторов, но еще применяются общесоюзные.
Основная цель разработки классификаторов связана с реализацией государственной программы перехода России на международные системы (учета, статистики). Данная программа была принята в 1992 г. Классификаторы оформляются в виде альбомов и есть машиночитаемый вариант. Свод всех классификаторов, а также нормативно-методические документы, составляют классификации и кодирования информации.
Основные задачи:
1) упорядочение и унификация технико-экономической и социальной информации;
2) обеспечение однозначности и сопоставимости данных;
3) создание условий для автоматизированной обработки данных;
4) создание банков данных классификаторов, применяемых на территории конкретной страны, а также международных делах.
Все классификаторы делятся на 3 группы:
1) классификаторы информации об управленческой документации, видах деятельности экономических и социальных показателей;
2) объединяет классификаторы информации об организационных словарях;
3) классификаторы информации о населении и кадрами.
Каждый классификатор имеет свое условное обозначение.
8. Функциональная стркутура ИПС.
Представляется в виде абстрактной кибернитической машиты. Котора состит из следующих узлов:
1) Устройство ввода.
Ввод сообщения, ввод запроса, индекстное описание текста - ПОД(поисковый образ документа).
2) Запоминающее устройство.
Активное хранилище - представляет собой совокупность поисковых образов сообщения.
Пассивное хранилище - в нем находится сами сообщения.
3) Решаущее устроиство .
Определение аресов сообщения. Главный исполнитель органа ИПС.
4) Устройство вывода.
получает адрес сообщения из решающего устройства, обеспечивает поиск в пасивном хранилищи и выводит их потребителю.
5) Устройство управления- обеспечивает последовательность методов поиска.
9. классификация ИПС.
При подходе к классификации ИПС исходит из требований пользователей к качеству функционирования системы, т.е. к ее способности выбирать из информационно-поискового массива требуемую информацию с достаточной полнотой, точностью и оперативностью.
Основными признаками, характеризующими ИПС с точки зрения удовлетворения требований пользователей, являются:
тематика комплектования информационно-поискового массива;
вид выполняемого информационного поиска (объект поиска и вид выдаваемой информации);
режим функционирования;
схемы размещения информацонно-поискового и документного массива:
вид выполняемого информационного поиска.
По тематике комплектования ИПС делится на отраслевые, многоотраслевые (политематические) и узкотематические.
Отраслевые ИПС создаются, как правило, центральными отраслевыми органами НТИ в соответствии с закрепленными за ними тематикой. На базе отраслевых ИПС осуществляется информационное обслуживание руководящих работников и ведущих специалистов отрасли.