Вступление........................................................................................................................ 2
1. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ.................................................................................................................. 3
1.1. Документальные и документографические БД.................................................. 3
1.2. Система баз данных о продукции........................................................................ 6
1.3. Экономическая и конъюнктурная информация............................................... 10
1.4.Фактографические базы социальных данных................................................... 11
1.5.Базы данных транспортных систем страны....................................................... 14
1.6. Справочные базы для населения и организаций.............................................. 16
1.7.Система ресурсных баз данных........................................................................... 17
1.8. Фактографические базы и банки научных данных.......................................... 19
1.9. ФБД в области культуры и искусства............................................................... 23
1.10. Лингвистические БД......................................................................................... 24
Заключение...................................................................................................................... 26
Список использованной литературы............................................................................ 27
В данной работе я постарался классифицировать существующие базы данных, а так же оценить перспективы их развития в нашей стране. Классификационным признаком является предметная область использования. Целью данной работы является так же анализ наиболее распространенных классов БД, получивших распространение и применение как в нашей стране, так и за рубежом.
В данной работе не акцентируется проблема передачи данных между БД, а лишь исследуется архитектура и общая организация самих БД.
Рассмотрим классы БД, получившие к настоящему времени наибольшее развитие в нашей стране. Это:
- документографические и документальные БД, создаваемые в органах НТИ и средствах массовой информации;
- БД по промышленной, строительной и сельскохозяйственной продукции;
- БД по экономической и конъюнктурной информации (статистическая, кредитно-финансовая, внешнеторговая);
- фактографические базы социальных данных, включающие сведения о населении и о социальной среде;
- БД транспортных систем;
- справочные данные для населения и учреждений (энциклопедии и справочники, расписания самолетов и поездов, адреса и телефоны граждан и организаций и др.);
- ресурсные БД , включающие фактографическую информацию о природных ресурсах (земля, вода, недра, биоресурсы, гидрометеорология, вторичные ресурсы и отходы, экологическая обстановка);
- фактографические базы и банки научных данных, обеспечивающие фундаментальные научные исследования;
- фактографические БД в области культуры и искусства;
- лингвистические БД, т.е. машинные словари разного типа и назначения.
Документографические БД содержат описания документов. В зависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными.
Документографические системы, как правило, строятся по двуконтурной схеме: первый контур содержит документографическую БД и используется для автоматизированного поиска документов, второй контур в случае необходимости обеспечивает выдачу полного текста документа в виде копии первоисточника на бумаге, микрофильме или выводит текст на экран с оптического диска (в некоторых случаях с жесткого магнитного диска большой емкости).
В составе данного класса выделены следующие виды БД:
- по публикуемым научно-техническим документам ;
- по публикуемым документам в области общественных наук;
- по патентным документам;
- по отчетам по НИР, ОКР, программным средствам ;
- по материалам межотраслевого обмена (научно-техническим достижениям, ППТО, ИЛ, каталожная, выставочная информация и т.п.);
- по стандартам и другой нормативно-технической документации;
- библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях;
- реферативные и полнотекстовые БД по общественно-политической информации, создаваемые средствами массовой информации;
- БД законодательной и правовой информации;
- документографические документографические по специальным видам документов ;
- БД по архивным документам. Анализ состояния дел с ДБД различных видов в стране показывает, что в настоящее время наибольшее развитие получили ДБД документографического типа, главным образом, по опубликованным документам в области научнотехнической информации, общественных наук, патентным документам, отчетам по НИР, ОКР и другим видам документов, созданные в рамках системы научно-технической информации.
В системе НТИ создан распределенный автоматизированный банк данных (РБнД) общим объемом более 20 млн. записей.
Порядка 30-40% записей относятся к отечественным первоисточникам, остальные - к зарубежным. В рамках РБнД созданы абонентские сети удаленных пользователей, охватывающие все столицы союзных республик и основные областные центры.
Доступ к БД предоставляется частями по жесткому расписанию. Доля одновременно доступных БД составляет 20% общего объема БнД системы НТИ.
РБнД поддержан вторым контуром, обеспечивающим выдачу пользователям исходных текстов документов. Однако, функционирование второго контура системы НТИ в настоящее время не соответствует современным требованиям, так как не обеспечивает гарантированного получения копии любого первоисточника в приемлемые сроки.
Не в полной мере соответствует современным требованиям и актуальность записей в РБнД системы НТИ, так как сроки поступления первоисточников в России, обработки их и ввода в БД в совокупности составляют несколько месяцев.
К документографическим БД НТИ тесно примыкают библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях. Функции этих систем совпадают почти полностью, что делает целесообразным их объединение.
Крупным недостатком сложившейся системы следует признать полное отсутствие полнотекстовых БД научно-технической информации, в особенности, полнотекстовых БД стандартов и нормативно-технической документов. Однако широкое распространение полнотекстовых БД общенормативного и нормативно-правового характера радует.
Средствами массовой информации (в основном центральны ми) создан и ведется ряд БнД по общественно-политической информации. Основная проблема БнД средств массовой информации заключается в полном отсутствии координации их создания и ведения, откуда проистекает разнобой в технологии, технических решениях, подходах к отбору и обработке информации.
Документографические БД по специальным видам документов функционируют для документов следующих видов:
Картографические документы - в ГБЛ и ГУГК. Эти документографические БД представляют собой, в сущности, обычные библиографические БД. В настоящее время объем совокупного БнД картографических документов незначителен.
- Чертежно-конструкторские и проектные документы. Документографические БД по документам этого вида существуют на отдальных предприятиях, где они разрабатываются, как правило, самостоятельно с использованием имеющихся программно-аппаратных средств. В результате полученные массивы, как правило, не совместимы между собой. Кроме того, эти массивы создаются в интересах управления деятельностью самого предприятия, и заинтересованность предприятия-генератора в предоставлении доступа к ним внешних потребителей обычно отсутствуют.
По-видимому, в настоящее время вопрос о включении этих документов в систему БД и БнД не стоит.
- Аудиовизуальные документы. В телекомпаниях существует документографическая БД по аудиовизуальным документам Центрального телевидения , используемая в интересах этих организаций. Теледоступ внешних потребителей к этой БД технически осуществим, но в настоящее время не предусматривается руководством этой организации. Формирование документографического БнД по архивным документам фактически только началось. Основная проблема в этом виде БнД состоит в очень большом объеме данных, подлежащих переработке и вводу в БнД, что потребует больших затрат и длительного времени. Задача облегчается наличием четкой структуры архивных органов и существованием координации этой работы между ними.
В целом можно отметить, что в стране существует несколько отдельных, не связанных между собой систем документографических БнД и отдельных БД этого класса, между которыми не всегда обеспечивается совместимость даже по данным. Планомерное и скоординированное развитие таких систем можно отметить только внутри следующих подсистем: документов научно-технической информации; по общественным наукам; патентных документов; отчетных документов; документов межотраслевого обмена; стандартов и нормативно-технической документов; законодательных документов; архивных документов. Между этими подсистемами координация слаба или отсутствует.
В других подсистемах нет и внутренней координации. Вместе с тем, и в тех подсистемах, которые развиваются планомерно, имеет место совершенно неоправданное дублирование функций, связанное с искусственным разделением информационных потоков по отрасли-источнику на общие документальные потоки и потоки группы отраслей промышленности. Применительно к открытой информации такое разделение излишне (а другая информация не относится к области рассмотрения настоящей концепции).
Сопоставление состояния дел в стране и за рубежом в области документографических БнД позволяет также отметить отсутствие или слабое развитие, неорганизованность и разрозненность в России некоторых видов документографических и документальных БнД, в том числе: