КУРСОВАЯ РАБОТА
На тему:
Реализация компонентов информационной системы архива спутниковых данных
Владивосток, 2008
Содержание
1. Введение
1.1 Глоссарий
1.2 Описание предметной области
1.3 Неформальная постановка задачи
1.4 Обзор существующих методов решения
2. Требование к окружению
3. Спецификация данных
4. Функциональные требования
5. Проект
5.1 Средства реализации
5.2 Модули и алгоритмы
5.3 Структуры данных
6. Реализация и тестирование
Заключение
Список литературы
· Метаданные – «данные о данных». Краткое структурированное описание, содержащее информацию об определённом ресурсе.
· Система метаданных (информационная система) – программный комплекс, включающий в себя базу метаданных, каталог данных на его основе, сопутствующие интерфейсы доступа и ряд обслуживающих утилит
· Каталог спутниковых данных – система, основанная на метаданных, предоставляющая пользователю информацию о файлах спутниковых данных организации
· База метаданных – база данных, содержащая записи метаданных
· Система инвентаризации (инвентарь) – часть системы метаданных, занимающаяся регистрацией размещения файлов и имеющая набор интерфейсов для доступа, в первую очередь автоматическом режиме
· Утилита инвентаризации – консольное приложение, предназначенное для регистрации файла в системе инвентаризации.
· Продукт – файл исходных данных или конечной продукции, который может быть зарегистрирован в системе.
· Архив – ресурс на файловом сервере, доступный по протоколам SMB (а также FTP/HTTP), содержит файлы продуктов.
· Идентификатор (файла) – строка определённого формата, однозначно идентифицирующая продукт Центра.
· Java Runtime Environment – исполнительная среда Java
· ИК канал – Инфракрасный канал
1.2 Описание предметной области
В настоящее время спутниковые данные широко используются как источник информации, необходимой для поддержки научно-исследовательской, хозяйствено-экономической, а также военно-политической деятельности человека на Земле. Количество спутников, поставляющих такого рода данные, непрерывно возрастает, также как и количество спутниковых центров, занимающихся приемом и обработкой этой информации.
Одним из таких спутниковых центров является Центр колективного пользования Регионального Спутникового Мониторинга Окружаюшей Среды ДВО РАН. Центр функционирует на базе Лаборатории спутникового мониторинга ИАПУ ДВО РАН [1].
Пользователями, которых интересует продукция спутниковых центров, обычно являются [2]:
· Исследователи природных объектов Земли
· Разработчики методов и средств измерений и исследований
· Природохранные организации
Основными целями пользователей является получение набора значений физических параметров, восстановленных на основе спутниковых данных, а также однозначная идентификация определённых объектов на изображениях. Типовой сценарий работы клиента спутникового центра включает в себя: выбор данных и типа их обработки; заказ обработки и получение её результатов.
Список базовых задач, решаемых спутниковыми центрами, обычно включает в себя [2]:
· Приём данных со спутников
· Хранение архива данных за некоторый промежуток времени
· Информационно-справочный сервис
· Обработка данных различного уровня, включая начальную коррекцию и тематическую обработку
· Доставка данных потребителю (как исходных, так и обработанных)
Вследствие огромного потока разнородной информации возникает множество проблем, связанных с хранением, поиском и получением конкретных данных, необходимых потребителю. В решении основной массы этих задач помогают метаданные. Обычное назначение метаданных – обеспечение пользователя исчерпывающей информацией о спутниковых изображениях архива как в целом, так и по конкретному изображению. Наличие этой информации позволяет пользователю быстро найти данные, пригодные для решения его задач.
Современной тенденцией развития спутниковых центров является их объединение в единые информационные сети. Это обусловлено неодинаковыми возможностями центров по работе с данными того или иного вида и необходимостью использовать данные других организаций. Основными проблемами такого обмена данными являются отличающиеся интересы участников, необходимость согласования стандартов обмена, а также вопросы оплаты и ограничений на применение данных.
Результатом выработки единой стратегии решения перечисленных проблем в Европейском космическом агентстве (ESA) явилась система SSE (Service Support Environment). Прототип системы был отлажен в рамках проекта MASS-ENV, существующего с 2001 года. Разработкой концепции, стандартов и ПО занимается группа компаний под предводительством Spacebel (Бельгия). Проект основан на открытых и общепризнанных технологиях, таких как Web Services и SOAP. Задачей системы является создание среды, объединяющей все службы дистанционного зондирования Европы и других стран.
1.3 Неформальная постановка задачи
Существующая в Центре информационная система включает базу метаданных для файлов данных спутников NOAA, веб-интерфейс и утилиту для сбора метаданных из файлов данных. Помимо этого на базе пакета SSE Toolbox осенью 2007 года был создан каталог данных, интегрированный в тестовом режиме в среду SSE. Встаёт задача интеграции наиболее важных ресурсов Центра в данную среду. Помимо этого, развитие системы распределённой обработки спутниковых данных, действующей в Центре, требует развития базы метаданных и программных интерфейсов для доступа к ней в рамках Центра.
На рис. 1 представлена архитектура разрабатываемой информационной системы:
1. Сбор информации о местоположении файла
2. Занесение информации в каталог (внешний URL файла)
3. Извлечение всей потенциально пригодной информации из файла и занесение её БД соответствующего типа
4. Отображение метаданных на каталог в соответствии с требованиями целевой системы
5. Интерфейс в одну из внешних систем
Рис. 1 Архитектура разрабатываемой информационной системы.
На данном этапе наиболее важной является реализация процедур сбора метаданных; а также организация системы инвентаризации, которая упростила бы поиск файлов спутниковых данных, находящихся на различных ресурсах (сетевых хранилищах и CD/DVD носителях).
Целью данной работы является:
· Создание набора классов, реализующих функции генерации метаданых для заданного файла данных спутника MTSAT-1R.
· Реализация системы инвентаризации.
В данный момент в Центре функционирует информационная система для файлов данных, полученных со спутников серии NOAA [3], она позволяет производить поиск и просмотр информации как через веб-интерфейс на сайте Центра, так и через сервер SSE Portal. Реализована утилита извлечения метаданных из файлов данных, полученных с полярно-орбитального спутника FY-1D.
Имеющиеся утилиты извлечения метаданных не могут быть использованы для файлов данных полученных со спутника MTSAT-1R, так как они имеют другой формат.
Новая архитектура системы метаданных потребовала создание подсистемы, отвечающей за справочную информацию о расположении и способе доступа к файлам спутниковых данных. До сих пор эта информация хранилась в базе метаданных наряду с остальными атрибутами. Решение этой задачи в рамках отдельной подсистемы (инвентаря) делает модернизацию и поддержку проще, позволяя компонентам эволюционировать независимо.
Минимальные аппаратные требования включают оперативную память 64 Мб, Процессор с частотой 500 МГц.
Также для работы программы необходима установка Java Runtime Environment версии не ниже 1.5.
Для инвентаризатора также необходима установка сервера PostgreSQL, JDBC драйвер для PostgreSQL.
Процедур сбора метаданных работает с данными, полученными со спутника MTSAT-1R и сохраненных в формате HIRID.
Файл данных состоит из кадров. Каждый кадр представляет собой данные описывавшие этот кадр, и значения полученные радиометрами спутника.
Процедур сбора метаданных требует:
• Методы для извлечения информации, используемой для заполнения полей метаданных
• Методы для генерации уменьшенного изображения
Изображение должно строиться по данным одного из каналов (ИК) и быть кодировано в формат grayscale JPEG и доступно в виде массива байт.
Модули, генерирующие метаданные на основе спутниковых данных должны реализовывать интерфейс MetadataSource. Этот интерфейс описывает произвольный источник метаданных для файлов полярно-орбитальных спутников. Интерфейс требует определения ряда методов для получения необходимой информации. Помимо этих методов, класс, реализующий данный интерфейс, должен иметь конструктор с файлом в качестве параметра (java.io.File).
Для инвентаризации необходимо:
· База данных инвентаризации.
· Утилита, заполняющая базу данных инвентаря данными о расположении файла.
· Утилита для извлечения этих данных из инвентаря.
Так как в связи с спецификой лаборатории необходима работа под любой платформой и существующая часть системы написана на языке Java в качестве языка программирования был выбран язык Java. Сервером базы данных был выбран PostgreSQL так как он уже функционирует в лаборатории.
Инструментарий разработки:
· Sun JDK 1.6 – компилятор + утилиты и библиотеки