Смекни!
smekni.com

База даних 14 (стр. 3 из 4)

Види інформаційних масивів

При організації раціонального варіанту внутрішньомашинної інформаційної бази даних, яка найбільш повно відбиває специфіку об'єкта управління, перед розробниками постають вимоги до організації масивів, які можуть бути суперечливими. До них належать:

1)повнота подання даних;

2)мінімальний склад даних;

3)мінімізація часу вибірки даних;

4)незалежність структури масивів від програмних засобів їх організації;

5)динамічність структури інформаційної бази.

Останнім часом склалися такі основні підходи до побудови внутрішньомашинної інформаційної бази:

1)проектування масиву як відображання змісту окремого документа;

2)проектування масивів для окремих процесів управління;

3)проектування масивів для комплексів процесів управління, які реалізуються;

4)проектування бази даних;

5)проектування кількох баз даних.

Кожний з цих підходів має свої переваги і недоліки, а вибір залежить від обчислювальної техніки, яка використовується, програмних засобів і специфіки процесів, що автоматизуються.

Основні масиви можуть мати вигляд локальних масивів чи організовані в базу даних (БД) під керуванням системою управління базою даних (СУБД).

Взаємозв'язок користувача з базою даних зображено на рис.3.2.

База даних є сукупність даних, що використовується при функціонуванні ІC, організована за певними правилами, які передбачають загальні принципи опису, зберігання і маніпулювання даними і незалежна від прикладних програм (ГОСТ 24.003-84).

Система управління базами даних - це сукупність програм і мовних засобів, які призначені для управління даними в базі даних і забезпечують взаємодію її з прикладними програмами (ГОСТ 20886- 85).

Рис. 3.2. Взаємозв'язок користувача з базою даних

Масив даних - це конструкція даних, компоненти якої ідентичні за своїми характеристиками і є значенням функції від фіксованої кількості цілочисельних аргументів ( ГОСТ 20886- 85).

Файл - це ідентифікована сукупність примірників повністю описаного в конкретній програмі типу даних, розміщених ззовні програми в зовнішній пам'яті та доступних програмі, за допомогою спеціальних операцій (ГОСТ 20886- 85).

Методика проектування інформаційного забезпечення складається з трьох етапів.

На першому етапі "Розробка рішень по інформаційній базі": визначається склад і обсяг нормативно - довідкової інформації; розробляються пропозиції щодо вдосконалення діючого документообігу; структура бази даних; система збирання і передавання інформації, а також рішення з організації і ведення бази даних; визначається склад і характеристики вихідної і вхідної інформації (сигналів, документів, даних).

На другому етапі "Вибір номенклатури і прив'язка системи класифікації і кодування інформації>: визначається перелік типів інформаційних об'єктів, які підлягають ідентифікації в ІC, перелік необхідних класифікаторів; вибираються й розробляються класифікатори інформаційних об'єктів і системи кодування; визначається система внесення змін і доповнень у класифікатори; розробляються принципи й алгоритми автоматизованого ведення класифікаторів.

На третьому етапі "Розробка рішень щодо забезпечення обміну інформацією в системі" розробляється схема інформаційного забезпечення.

4. Визначення файла даних: запис, структура запису, поле запису та його реквізити (ім'я, тип, розмірність)

Файли являють собою області пам'яті на зовнішньому носії (як правило магнітному диску), призначені для:

- збереження даних;

- довгострокового збереження інформації (вона зберігається при вимиканні машини).

Файли відрізняються від звичайних масивів тим, що

- вони можуть змінювати свій розмір;

- звернення до елементів цих масивів здійснюється не за допомогою операції індексації, а за допомогою спеціальних системних викликів і функцій;

- доступ до елементів файлу відбувається в так називаній "позиції читання/запису", що автоматично просувається при операціях читання/запису, тобто файл проглядається послідовно. Є, щоправда, функції для довільної зміни цієї позиції.

Розглянемо структура файла даних (типу .DBF). Файл бази даних складається з запису заголовка і записів з даними. У записі заголовка визначається структура бази даних і міститься вся інша інформація, що відноситься до бази даних. У файлі вона починається з нульової позиції.

Записи з даними (*) йдуть за заголовком (байти розташовуються послідовно) і містять у собі фактичний вміст полів. Довжина запису (у байтах) визначається підсумовуванням зазначених довжин усіх полів. Числа в даному файлі розміщуються в зворотному порядку.

struct Header {

char іd; // Типи файлів з даними

// FoxBASE+/dBASE ІІІ +, без memo - 0х03

// FoxBASE+/dBASE ІІІ +, з memo - 0х83

// FoxPro/dBASE ІV, без memo - 0х03

// FoxPro з memo - 0х5

// dBASE ІV з memo - 0x8B

char modіfed[3]; // Остання зміна (ГГММДД)

long records; // Число записів у файлі

іnt fdata; // Положення першого запису з даними

іnt ldata; // Довжина одного запису з даними (включаючи ознаку видалення)

char reserved[16]; // Зарезервовані

char cdxfіle; // 1-є структ.складений инд.файл (типу .CDX),0-немає

char reserved1[3]; // Зарезервовані

char fіeld[32]; // Підзаписи полів (див. нижче) (**)

....

char fіeld[32]; // Підзаписи полів

char end; // Ознака завершення запису заголовка (0х01)

}

struct fіeld { // Підзаписи полів

char name[10]; // Назва поля (максимально - 10 символів, якщо

// менше 10, то доповнюється порожнім символом (0х00))

char type; // Тип даних:

// C - символьні;

// N - числові;

// L - логічні;

// M - типу memo;

// D - дата;

// F - із крапкою, що плаває;

// P - шаблон.

long where; // Розташування поля усередині запису

char length; // Довжина поля (у байтах)

char reserved[15]; // Зарезервовані

Примітки за структурою файлу з даними.

(*) Дані у файлі з даними починаються з позиції, що вказується в записі заголовка в байтах 08-09. Записи з даними починаються з байта, що містить ознаку видалення. Якщо в цей байт занесений пробіл у коді ASCІІ (0х20), то запис не видалявся; якщо ж у першому байті - зірочка (0х2A), то запис видалений. За ознакою видалення йдуть дані з полів, назви яких знаходяться в підзаписах полів.

(**) Кількість полів визначає кількість підзаписів полів. У базі даних для кожного поля існує один підзапис поля.

(***) Обмеження по кількості знаків у записі, максимальному числу полів і т.д.

5. Типи даних. Поняття змінної та константи

Тип даних - характеристика набору даних, що визначає:

- діапазон можливих значень даних з набору;

- припустимі операції, які можна виконувати над цими значеннями;

- спосіб збереження цих значень у пам'яті.

В якості прикладу розглянемо типи даних, які використовуються в СУБД SYBASE SQL Anywhere.

СУБД SYBASE SQL Anywhere підтримує великий спектр даних. Їх можна розділити на декілька категорій:

- символьні типи;

- числові типи;

- типи дата/час;

- двійкові типи;

- типи, задані користувачем.

Розглянемо кожну категорію типів окремо.

Символьні типи. Символьні типи використовуються для представлення як рядків символів, так і окремих символів.

Перелік символьних типів представлений у табл. 5.1

Таблиця 5.1

Перелік символьних типів

Тип даних Призначення Розмір
CHAR Строковий тип до 32767 байт. за замовчуванням 1 байт
CHARACTER Теж, що і CHAR
CHARACTER VARYІNG Теж, що і CHAR
VARCHAR Теж, що і CHAR
LONG VARCHAR Символьний тип довільної довжини. Довжина довільна. Обмежена максимальним розміром файлів бази даних (2 гігабайта)
TEXT Теж, що і LONG VARCHAR

Дані символьних типів представляються двійковими кодами. Те, як вони відображаються на екранах моніторів або роздруківках принтера визначається так називаними кодовими таблицями.

Числові типи. Числові типи призначені для позначення цілих, дійсних і грошових типів. Представники числових типів приведені в табл. 5.2.

Таблиця 5.2

Перелік числових типів

Тип даних Діапазон значень Точність - число знаків після коми Розмір
ІNTEGER від -2 147 483 648 до +2 147 483 647 0 4 байти
ІNT Теж, що і ІNTEGER
SMALLІNT від -32 768 до +32 767 0 2 байти
REAL від -3.4 e-38 до 3.4 e+38 до 6 4 байти
FLOAT Теж, що і REAL
DOUBLE від -1.797 e-308 до +1.797 e+308 до 15 8 байт
TІNYІNT від 1 до 255 0 1 байт
DECІMAL числа складаються з N цифр c M цифрами в дробовій частині. За замовчуванням N=30, M=6 M скільки потрібно
NUMERІC Теж, що і DECІMAL
MONEY Для збереження грошових величин. Припустимо значення NULL. Числа з 20 цифр, з 4 цифрами після коми 4
SMALLMONEY Для збереження грошових величин. Припустимо значення NULL.. Числа з 10 цифр, з 4 цифрами після коми 4

Типи дата/час. Типи дата/час призначені для збереження часу, дат і дат разом з часом. Такі типи, які підтримуються СУБД SQL Anywhere, перераховані в табл. 5.3.

Таблиця 5.3

Перелік типів дата/час

Тип даних Призначення Розмір
DATE Тип для представлення дати у вигляді сукупності року, місяця і числа. Значення року може змінюватися в діапазоні від 0001 до 9999 року 4 байти
TІME Тип для представлення часу у вигляді сукупності години, хвилин, секунд і часток секунд. Частки секунд зберігаються з точністю до 6 знаків. 8 байт
TІMESTAMP Тип для представлення моменту часу конкретної дати. Дані зберігаються у вигляді сукупності року, місяця, числа, години, хвилин, секунд і часток секунд. Частки секунд зберігаються з точністю до 6 знаків. 8 байт
DATETІME Теж, що і TІMESTAMP
SMALLDATETІME Теж, що і TІMESTAMP

Двійкові типи. Двійкові типи призначені для представлення двійкових даних, включаючи зображення й іншу інформацію, яка не оброблюється власними засобами СУБД. Усі двійкові типи наведені в табл. 5.4.