В зависимости от способа взаимосвязей элементов схемы и записей различают иерархические, сетевые, списковые, реляционные структуры БД. Наиболее предпочтительной является реляционная модель, котороая строится на понятии отношения и исключает недостатки, присущие сетевой и иерархической структурам.
Схема 1. Распределенная схема обработки данных
2.2 Организация сбора и передачи информации
Система представлена следующими видами информации: оперативная, неоперативная, учетная, плановая, текущая.
В течение дня в филиале банка собирается и формируется информация, которая затем передается для дальнейшей обработки в центральный офис. Формируются мемориальные ордера по учету прихода и расхода для вкладного отдела физических лиц и для аналогичного отдела юридических лиц, ордера отчетов по валюте и суммы выручки, отчет по кассе. Дааные вводятся в ЭВМ с клавиатуры, а затем через "почтовый ящик" передаются в центральный офис. Если операция с клиентами какого-либо филиала совершалась в центральном офисе, то через "почтовый ящик" необходимо потребовать расписку. В начале каждого дня по телефону сообщается в центральный офис приход и расход по операциям с клиентами. В течение дня ¾ необходимая информация, также может быть получена справочная информация. Отчет в бухгалтерии составляется за каждый день, а затем ¾ общие итоги в конце каждой недели и месяца. В конце месяца ссотавляется баланс для проверки деятельности каждого филиала. Все эти данные поступают в центр, где подвергаются дальнейшей обработке для полного и достоверного анализа деятельности банка. Центральный офис получает также информацию из Национального банка Украины, а затем оперативная немедленно передается в отделы. Проанализировав информационные потоки, можно сделать вывод: соблюдается логичность маршрута, отсутствуют паралелльные потоки, документы передаются в установленные сроки.
Требования к входной и выходной информации представлены в таблице 2 и 3.
На схеме 2 представлен документооборот.
Схема 2. Документооборот и маршруты документов.
2.3 Система классификации и кодирования
Система кодирования информации включает два основных метода кодирования: идентификационный и классификационный.
Идентификационное колирование предполагает лишь выделение данного объекта из множества других; каждому объекту присваивается номер по порядку. Система построения кода проста и экономична, так как используются малозначные коды. При незначительнм увеличении длины кода обеспечивается долговечность кодификатора. Недостатком же является практически отсутствующая информативность кода и фактически обеспечивается только возможность отличить один объект от другого.
Идентификационный метод бывает двух типов: порядковый и серийный (серийно-порядковый). Порядковый тип заключается в последовательной порядковой регистрации объектов. К достоинствам относят: наибольшую емкость, простоту для идентификации объектов, использование наиболее коротких кодов. Однако, в коде отсутствует информация о свойствах объекта, существует сложность автоматизированной обработки информации пр получении итогов по группе объектов. Применяется для кодирования небольших массивов объектов с одним признаком. Серийный тип ¾ каждой группе объектов отводятся последовательные серии номеров. Причем, каждая серия строится по порядковой системе кодирования. Достоинства типа определяются простотой построения, наличием резерва номеров, сравнительной малозначностью кодов. Недостатки состоят в том, что существует сложность построения серий номеров для объектов, характеризующихся многими свойствами; сложность автоматизированной обработки информации при суммировании итогов по группе объектов. Применяется для колирования объектов с небольшим числом признаков.
Классификационный метод основан на предварительной классификации объектов, то есть предполагает разделение всего множества объектов на группировки по избранному признаку классификации.
Включает два типа: последовательная и параллельная сситемы кодирования.
Последовательная система состоит в том, что код нижестоящей группировки образуется путем добавления кодов соответствующего количества разрядов к коду вышестоящей группировки. Система чаще всего используется при иерархической системе классификации. Преимущества: логичность построения кода, большая емкость, возможность получения итогов по старшим разрядам. Недостатки: жесткость структуры кода, которая не позволяет изменять или исключать отдельные признаки без перекодировки информации. Поэтому систему целесообразно использовать в классификаторах, когда перечень решаемых задач не изменяется в течение длительного времени и совокупность признаков достаточно долго остается неизменной.
Параллельная система обычно строится на основе предварительной фасетной классификации свойств объектов. При этом для обозначения фасета выделяется определенный разряд или группа разрядов кода. Достоинства системы в том, что независимое кодирование, с одной стороны обеспечивает простоту автоматизированной обработки информации по отдельным признакам или их совокупности, с другой стороны, достигается гибкость структуры кода. Недостатком является большая, по сравнению с другими системами, избыточность информации, то есть неполное использование емкости системы классификации.
В зависимости от того, рассматривается ли заданное множество объектов последовательно или одновременно по всем признакам основания деления, различают фасетную и иерархическую системы классификации.
Под иерархической системой понимается система, между классификационными группами которой устанавливается отношение соподчинения. Она строится по следующему принципу: исходное множество объектов делится сначала по некоторому признаку на крупные группировки. Каждая группировка, в свою очередь, в соответствии с выбранным признаком делится на ряд последующих группировок, которые затем подразделяются на более мелкие, постепенно конкретизируя свойства объекта. Преимущества системы: логичность построения, большая емкость, хорошая приспособленность для ручной обработки. Недостатки: обладает жесткой структурой, фиксированным составом и порядком следования классификационных группировок. В связи с этим она не позволяет составлять произвольные группировки по таким сочетаниям признаков, которые не были предусмотрены иерархической классификацией.
Указанные недостатки отсутствуют в фасетной системе. Здесь предусматривается деление исходного множества на подмножества по различным признакам классификации не последовательно а независимо и каждый раз эта операция производится над исходным множеством. В этой системе в качестве основания деления применяется параллельно несколько независимых признаков и классифицируемое множество объектов образует независимые классификационные группировки ¾ фасеты. Преимущества: возможность практически неограниченного добавлена числа фасетов; хорошая приспособленность к машинной обработке информации.
2.4 Организация внутримашинной базы
Состав внутримашинного ИО показан на рис. 1.
В качестве структурной модели БД используется реляционная модель. В основе лежит понятие отношения. Фактически БД представляет собой совокупность таблиц отношений, в которых строки являются кортежами, а столбцы ¾ доменами.
Для РМД характерно:
Þотсутствие одинаковых строк;
Þпроизвольное взаимное расположение строк и столбцов;
Þкаждый элемент отношения, стоящий на пресечении строк и столбцов, не может быть составным.
При организации РБД каждый домен помечается идентификатором.
В РБД поисковые запросы формируются на языке, основанном на алгебре отношений. Результатом поиска может быть как один кортеж, так и несколько кортежей, состоящих из одного или нескольких доменов.
Преимущества РБД:
1. простота построения и восприятия;
2. практически готовый простой и гибкий язык, взятый из алгебры отношений;
3. легкость реорганизации БД (перестановка строк и столбцов, добавление новых, удаление);
4. простота работы с БД для широкого круга пользователей.
Недостатки Реляционной модели данных:
низкая эффективность использования ресурсов вычислительной системы, но нет тех недостатков, которые имели место в иерархической и сетевой моделях.
Группа БД ¾ распределенная. В случае централизованной БД при очень больших объемах данных для любой ее организации усугубляется проблема ее ведения и поддержания в актуальном состоянии. Кроме того, с ростом объема данных нелинейно, то есть очень быстро, возрастает время поиска и извлечения необходимых данных, время доступа к ним. Это приводит к необходимости разделения БД, ее рапсределении по местам сбора и обработки данных при сохранении возможности взаимного обмена между распределенными частями общей БД или локальными БД.