Способ организации упрощенного доступа к накопленным гетерогенным информационным ресурсам
И.Г. Игнатова, Ю.С. Шевнина
Введение
Нарастающая с каждым годом информатизация общества привела к накоплению огромного количества разнородных гетерогенных информационных ресурсов (ИР) по различным отраслям знаний [1, 2]. Но, несмотря на то, что накопленные информационные ресурсы объединяются в различные электронные коллекции и библиотеки, размещаются в свободном доступе на серверах и порталах глобальной сети Интернет, большая их часть недоступна широкому кругу общественности. В сложившейся ситуации поисковые системы осуществляют поиск нужных данных по запросам в свободной форме, в результате чего пользователь получает огромное количество «шумовой» информации, среди которой очень трудно выбрать действительно полезные знания. Причиной этому является не только слабая структуризация сведений о ресурсах, но и слабая адаптация этих сведений, а также элементов поисковых интерфейсов к специфике конкретного направления предметной области деятельности потребителя ИР. Таким образом, становится очевидна проблема организации доступа к накопленным распределенным гетерогенным информационным ресурсам [3].
В 90-х годах прошлого столетия начинают говорить [4, 5] не только о технологической составляющей доступа к ИР, но и о его ориентации на конечного пользователя – доступ к ИР должен быть простым и удобным. Это прежде всего удобство и простота использования компьютерных сетей и самой информационной инфраструктуры. Для того, чтобы считаться простой и удобной, компьютерная система [6] должна позволять пользоваться ею без специального обучения. Второй составляющей удобства и простоты доступа является совокупность всех навыков, которыми обладает пользователь. Доступ ограничивается умениями конкретного потребителя ИР пользоваться имеющейся в наличии техникой и информацией. Поэтому система, предоставляющая доступ к накопленным распределенным гетерогенным ИР, должна обеспечивать их качественный поиск, позволять адаптировать элементы описаний ресурсов и элементы пользовательских интерфейсов к специфике предметной области, а также должна предоставлять возможность оперативного информирования пользователей о новых поступлениях необходимых им ресурсах. Это позволит обеспечить потребителей ИР актуальными данными о текущем состоянии и характеристиках необходимой им информации, а облегченный доступ к ресурсам приведет к увеличению эффективности работы.
1. Предлагаемое решение проблемы организации доступа к информационным ресурсам
Для решения проблемы организации доступа к накопленным разнородным гетерогенным информационным ресурсам предлагается использовать профилированные (т.е. настроенным на профиль определенного рода деятельности) интерфейсы пользователя, в которых используется специфичная для конкретной предметной области деятельности терминология.
При организации построения профилированных интерфейсов для конечных потребителей ИР встают проблемы адаптации структуры элементов интерфейса и семантики метаописаний ИР к специфике конкретной предметной области деятельности, и проблемы, связанные с ограничением информационных потоков, поступающих к потребителю ИР.
Для решения этих задач в инструментально комплексе ИСХИ[1] (инструмент систематизации и хранения информации) [7] был предложен механизм, основой которого являются базовая модель представления ИР и метод ее адаптации к специфике конкретной предметной области[2]. В качестве базовой модели представления ИР был выбран международный стандарт Dublin Core (DC) Metadata Set [8], как наиболее универсальный и простой по содержанию и реализации. Для учета специфики предметной области деятельности строится ее онтологическая модель. Для отображения полученной онтологической модели в интерфейсах пользователей предлагается использовать шаблон для представления ИР. Более подробно базовая модель и шаблон представления ИР описаны в работах [9, 10]. В процессе исследования были сформулированы следующие основные правила (предлагаемые действия) адаптации базовой модели представления ИР к специфике конкретного направления предметной области деятельности:
1. Установление соответствия между элементами стандарта DC и терминологией предметной области, выявленной в результате онтологического анализа этой предметной области.
2. Определение элементов, которые будут представлены в виде рубрикаторов.
3. Формирование перечня терминов предметной области деятельности для каждого из рубрикаторов.
4. Параметризация представления структуры базового шаблона с учетом пп.1-3.
Настройка базовой модели представления ИР на онтологию предметной области позволяет формировать специализированные шаблоны представления ИР и использовать их при построении профилированных интерфейсов пользователей для различных направлений предметной области деятельности [11].
2. Профилированные доставочные интерфейсы пользователя
Для осуществления быстрого доступа конкретной целевой аудитории к определенным ИР (объединенным по одному или нескольким параметрам), а также решения вопросов оперативной доставки информации пользователю применяются так называемые доставочные шаблоны. Одной из составных частей доставочного шаблона является прогнозируемый набор параметров поиска, на основе которого формируется поисковый запрос в центральное хранилище метаописаний информационных ресурсов. Автоматическое формирование такого поискового запроса ограждает конечного потребителя от лишних действий. Особенностью реализации доставочных шаблонов является назначение правил доступа к информационным ресурсам в зависимости от места вхождения пользователя в систему. А для решения одной из задач идентификации пользователей корпоративной среды в реализации доставочных шаблонов предусмотрена идентификация по IP-адресу компьютера, с которого был выполнен вход в систему предоставления доступа к накопленным информационным ресурсам.
Используя доставочные шаблоны можно строить профилированные доставочные интерфейсы, элементы которых будут более адаптированы на специфику конкретного направления предметной области деятельности.
Структурная схема доставочного шаблона представлена на рисунке 1. Первая часть (1) представляет собой список средств организации доставочных шаблонов, вторая (2) – список параметров для организации поиска информационных ресурсов и построения профилированного доставочного интерфейса пользователя.
Рисунок 1 – Структурная схема доставочного шаблона представления ИР
Параметры для организации поиска информационных ресурсов и построения профилированного доставочного интерфейса пользователя можно разделить на три группы – параметры поиска, параметры организации доступа и параметры внешнего представления. Параметры поиска представляют собой пары: название поля DC и его значение при поиске, - и определяются по результатам анализа потребностей конечных пользователей. В качестве параметров организации доступа используется список IP адресов или диапазонов IP адресов, тех компьютеров или локальных зон, пользователям которых разрешено без дополнительной авторизации работать с предлагаемой системой, поскольку очень часто авторизация бываем препятствием для широкого круга людей в рамках одной корпорации. Параметры внешнего представления предназначены для формирования профилированного доставочного пользовательского интерфейса в цветовой гамме того сайта (страницы сайта), на котором будет встраиваться интерфейс.
Организацию доступа к накопленным информационным ресурсам с использованием доставочных профилированных интерфейсов пользователя можно представить в виде схемы, изображенной на рисунке 2.
Рисунок 2 – Схема организации доступа к ИР на основе доставочного шаблона представления ИР.
После положительного результата сравнения IP адреса пользователя со списком разрешенных адресов происходит формирование поискового запроса к центральному репозиторию на основе параметров поиска, заранее определенных в доставочном шаблоне представления ИР. Поиск ресурсов по заданным параметрам осуществляется с помощью процедура поиска по коллекции ИР, описанной выше. Результаты поиска отображаются в профилированном интерфейсе поиска, сформированном на основе базового или производного шаблона представления информационных ресурсов.
Рассмотрим более подробно процедуру формирования доставочного интерфейса (рисунок 3). Получив от процедуры поиска по коллекции ИР результаты поиска (список идентификаторов найденных ресурсов) процедура формирования доставочного интерфейса обращается к таблице БД «Информационный ресурс» для получения сведений по каждому из найденных ресурсов (название ресурса, владелец, дата размещения, ссылка для ресурсов типа файл/каталог/сетевой).
Рисунок 3 – Блок-схема процедуры формирования профилированных доставочных интерфейсов.
Найденные ресурсы с учетом полученных о них сведений отображаются в форме таблицы в профилированном интерфейсе результатов поиска. Вид таблицы, набор выводимых сведений и доступных операций в профилированном интерфейсе зависит от уровня доступа пользователя. Описания информационных ресурсов строятся на основе шаблона представления ИР. Для корректного отображения структуры элементов метаописания также используется шаблон представления ИР, указанный в качестве основного для организации работы с этим метаописанием. В качестве такого шаблона может выступать любой из используемых в системе, им может быть как базовый, так и производный. Идентификаторы шаблонов представления ИР хранятся в таблице БД «Сведения о шаблоне», для определения идентификатора конкретного шаблона необходимо организовать запрос к таблице БД «Сведения о шаблоне», условием в котором будет выступать идентификатор ресурса.