Частотные словари позволяют выбрать лексические единицы, которые с большой эффективностью могут быть использованы не только для идентификации документа, но и поиска информации в нем. Уменьшаются затраты времени, средств при подготовке деловых документов, статистических отчетов и др.
Методы статистического индексирования документов основаны на научном предположении о том, что частота употребления слов связана с их значимостью для смысла документа. У этой гипотезы есть серьезные оппоненты. Но создание частотных микрословарей при подготовке информационных продуктов, научно-аналитических отчетов, обзоров и других видов документов весьма полезно и эффективно. Фрагмент частотного словаря приведен ниже (табл. 4).
Алфавитный порядок используется при кодировании ключевых слов. Представление о видах записей ключевого слова дано на рис 9.
Таблица 4
Результаты анализа встречаемости ключевых слов в заглавиях информационного массива 68 документов, вошедших в научно-аналитический обзор «Проблемы комплекса автоматизации и механизации производства» и 15 документов, используемых для иллюстрации настоящей методики
№ п/п | Ключевое слово, термин, понятие из заглавия документов, обзора | Частота встречаемости слов в коллекциях документов | |
68 документов | 15 документов | ||
1. | Автоматизация | 10 | 2 |
2. | Детали корпусные | 4 | 2 |
3. | Внедрение | 8 | 1 |
4. | Загрузочное устройство | 2 | 1 |
5. | Исследования | 15 | 4 |
6. | Комплексы станочные, автоматиз. | 2 | 2 |
7. | Линии гибкие, автоматизированные | 13 | 4 |
8. | Машины роторные | 6 | 2 |
9. | Машиностроение | 8 | 2 |
10. | Механизация комплексная | 4 | 2 |
11. | Моделирование | 1 | 1 |
12. | Методология | 5 | 1 |
13. | Обработка материалов (технология) | 11 | 3 |
14. | Перспектива | 1 | 1 |
15. | Производство гмбкое, автоматиз. | 5 | 2 |
16. | Процесс производственный, технологич. | 7 | 2 |
17. | Разработка | 21 | 6 |
18. | Роботы промышленные | 5 | 2 |
19. | Системы станочные, автоматиз. | 9 | 2 |
20. | Создание | 9 | 2 |
21. | Средства вычислительной техники (ЭВМ) | 5 | 1 |
22. | Состояние | 1 | 1 |
23. | Станки с ЧПУ | 1 | 2 |
24. | Структура | 3 | 1 |
25. | Тело вращательное | 3 | 1 |
26. | Управление | 3 | 1 |
27. | Участок опорный (опытный) | 3 | 1 |
Образование информационных массивов преследует цели:
• частотный словарь (табл. 4) - инструмент для оценки весомости лексических единиц при построении плана содержания информационного пособия;
• результаты лексико-семантической обработки заглавий документов, (табл. 5), необходимы для определения информативности фрагментов документов на этапе их сегментации (выделения);
• указатель соответствия (табл. 6), используется не только для поиска информации в информационных массивах, организованных на основе различных ИПЯ, но и систематизации записей в информационных пособиях (РЖ, сборники НИР и ОКР, и др.);
• рубрикатор-план (табл. 7) для логической организации фрагментов документов в информационном пособии.
В методических рекомендациях использованы формализованные методы обработки информации на всех этапах создания обзора (поиска информации, аналитико-синтетической обработки, индексирования, организации информационных массивов, включая информационный анализ документов и логической организации сегментов текстов документов). См. Приложение 2.
2.4. Формализованный метод исследования текстов документов
Метод формализованного исследования текстов документов нашел широкое применение в информационной технологии, в частности: аналитико-синтетической переработки документов (библиографирование, аннотирование, реферирование, индексирование, поиск информации).
Формализованный анализ используется в общей и русской идеографии - науке, которая разрабатывает теоретические основы создания семантических полей, лингвистических словарей - тезаурусов., частотных словарей, словарей встречаемости.
Таблица 5
Лексико-семантическая обработка заглавий документов
№ п/п | Ключевое слово, термин, научное понятие | Частота встречаемости в документах | Индекс УДК | Содержание индекса | Ключевое слово, термин, научное понятие и их толкование | |
1 | Автоматизация | 2 | 7.28 | 62-52 | Автоматические контролирующие, регулирующие, управляющие машины. | Использование технических средств, экономико-математических методов и систем управления без непосредственного участия человека. |
2 | Детали комплексные, корпусные | 2 | 28.46 | 62-214 | Типы и виды корпусов (цельные, составные, разъемные и т.д.) | Составные части и их простейшие соединения в машинах, приборах, аппаратах, приспособлениях и др. |
3 | Внедрение | 1 | 18 | 621.9.004.1 | Способы обработки применения, внедрения, эксплуатации. | Использование в производстве, практике результатов и научных исследований эксперимента. |
4 | Загрузка | 1 | 18 | 621.86.067 | Загрузочные устройства. | Заполнить работой машину, станок, прибор. |
5 | Исследование | 4 | 17.18 26.50 | 621.9.001.2 | Способы обработки исследований условий реализации. | Составная часть научно-исследовательского процесс, экспериментальная работа. |
6 | Комплексы станочные автоматизированные | 2 | 28.46 | 621.9-114 | Многооперационные машины, комбинированные машины для автоматической переналадки. | Совокупность автоматизированных станков, предназначенных для обработки металла (материалов). |
7 | Линии автоматизированные гибкие поточные переналаживающиеся | 4 | 11.26 11.28 50.26 | 621.9-114 | Гибкие автоматизированные линии состоят из нескольких производственных модулей, объединяющихся автоматизированной системой управления, в которой технологическое оборудование расположено, а принятой последовательности технологических операций. | |
8 | Машина роторная технологическая | 1 | 1 | 62-13 | Машины с вращательным движением рабочих органов роторной линии. | Машины, в которых исполнительным органом является ротор. Роторными машинами оснащаются в машиностроении автоматические роторные линии. |
9 | Машиностроение | 2 | 7.65 | 621 | Машиностроение. | Отрасль промышленности, занятая производством машин, оборудования и продукции оборонного значения. |
9а | Механизация комплексная | 2 | 29 | 65.011.54 | Применение машин и механизмов для всех основных и вспомогательных работ, выполняемых в ходе производственного процесса на базе комплексной механизации. | |
10 | Моделирование | 1 | 23 | 621.9.001.57 | Научно-технические исследования в машиностроении. | Научно-исследовательская деятельность - совокупность различных научно-исследовательских процессов, выполняемых исследователями, научными группами, научными учреждениями. |
11 | Модуль | 1 | 65 | 681.3 | Электронно-вычислительные машины. Программирование. | Способ построения систем в автоматизированных технологиях, создание унифицированных узлов, цепей, сложных цепей, выполняющих самостоятельную функцию. |
12 | Алгоритм | 1 | 65 | 519.85 | Алгоритм из системы последовательно выполняемых преобразований над текстами определенного вида (словами, индексами, дескрипторами, числами и т.п.) | |
13 | Методология | 1 | 65 | .001.23:621.9 | Теоретическая точка зрения изучения комплексной автоматизации и механизации в машиностроении | Учение о научных методах познания, принципах, способах организации теоретической и практической деятельности. |
14 | Станки с ЧПУ | 50 | 56 | 621.91 | Обработка резанием (снятие стружки) | Металлорежущие машины для обработки изделия, в основном, снятием стружки. Универсальные специализированные специальные станки с ЧПУ. |
15 | Обработка резанием | 3 | 28.48 50 | 621.9 | Обработка резанием, снятие стружки, резка (разделение операций, изготовление резьбы). Технология. | Способы обработки металлов давлением, резанием, холодом. |
16 | Перспективы | 1 | 68 | .004.122:621.9 | Точное описание. Применение. Внедрение. Эксплуатация. | Новые способы, принципы, знания об успешном развитии производства. |
17 | Производство гибкое автоматизированное | 2 | 43.56 | 621:338.45 | Отрасль промышленности - машиностроение. Экономика промышленности. | Относительная обособленная часть технологического процесса, результатом которого является выполнение комплекса работ, связанных с получением продукта, готового изделия. Различают производство единичное, крупносерийное, массовое. |
18 | Процесс производственный | 4 | 7.17. 62.65 | 338.912:621.9. | Экономика - производственный цикл (металлообработка). | Работа всех производственных компонентов гибкой автоматизированной линии - технологического оборудования., складских транспортных систем, участков сборки и другие координирующих работу - как целый многоуровневой системы управления. |
19 | Разработка | 6 | 17.18. 28.46. 50.65 | .002:621.9 | Теоретические исследования, предпосылки, подготовительные и организационные мер. По проведению НИР в технологии обработки металлов. | Последовательное, всестороннее исследование процессов обработки во всех производственных единицах. |
20 | Работы промышленные | 2 | 5.18 | 621.865.8:621.757 | Вспомогательные подъемно - транспортные устройства при монтаже машин в целом. | Промышленный робот-манипулятор с автоматизированным управлением, используется для сборки, переналадки, перестановки деталей, материалов в условиях недоступности. |
21 | Система станочная автоматизированная | 1 | 46 | 621.9-114 | Многооперационные машины, многооперационные станки, комбинированные машины для автоматизированных линий. | Система - целое, состоящее из станков, комплексов, связанных друг с другом, выполняющих свою специфическую работу. |
22 | Создание | 1 | 46 | 338.912 | Экономика - Производственный цикл. | Работа по изготовлению продукции. |
23 | Состояние | 1 | 68 | 338.96 | Объем производства. Экономика промышленности. | Положение внутреннего, внешнего производства. |
24 | Средства вычислительной техники | 1 | 50 | 519.85:621.9 | Использование вычислительной техники в технологиях обработки машиностроительного производства. | Совокупность технических и программных средств способов и методов обработки информации для управления технологическими процессами и производством. |
25 | Структура | 1 | 23 | 656:621 | Организация производства машиностроения. | Организационно-функциональные устройства управления производством. |
Таблица 6