Смекни!
smekni.com

Класи технологій проектування. Поняття і основні системи кодування економічної інформації. Проектування процесу введення паперових документів (стр. 2 из 3)

Паралельні системикодування характеризуються тим, що вони будуються на основі використання фасетної системи класифікації і коди угрупувань після фасетів формуються незалежно один від одного.

Послідовні і паралельні системи кодування будуються на базі розрядної або комбінованої системи кодування.

Розрядна системазастосовується для кодування об'єктів, визначуваних декількома супідрядними ознаками, використовуваними для вирішення економічних завдань. Кодовані об'єкти систематизуються за класифікаційними ознаками на кожному ступені класифікації, кожній ознаці відводиться певне число розрядів, в межах яких кодування угрупувань починається з одиниці. При розрядній системі кодування має місце так зване «залежне» кодування. Це означає, що класифікаційні угрупування за молодшими ознаками кодуються залежно від коду угрупування, утвореного за старшою ознакою. Запас вільних позицій визначається структурою коду.

Код об'єкту, побудований по цій системі, складається з такого числа позицій (чи числа груп розрядів), скільки було враховано ознак для об'єктів, тому розрядна система кодування називається інодіпозиційною системою.Конкретне значення ознаки, що характеризує об'єкт, визначається позицією і значенням певного числа в структурі коду. Довжина коду зави-сит від числа східців класифікації, від числа класифікаційних угрупувань на кожному ступені і від основи кодування.

Комбінована системакодування, володіючи усіма перевагами розрядного коду, застосовується для кодування великих номенклатур (переліків) об'єктів, які характеризуються багатьма супідрядними або незалежними ознака-мі. Ця система базується на поєднанні принципів побудови таких систем кодування, як розрядна, серійна, порядкова і кода повторення.

Код повторення (мнемокод)- це буквені або буквено-цифрові коди, які характеризуються тим, що в структуру коду переносять частину символьних позначень об'єктів з метою підвищення мнемонічності коду або для скорочення його довжини.

Вибір конкретної системи кодування залежить від об'єму кодованої номенклатури, її стабільності, від завдань, що стоять перед системою, і від показників ефективності обробки інформації при використанні якої-небудь системи.


3. Проектування процесу введення паперових документів

Одним з основних завдань, пов'язаних із скороченням витрат на обробку даних, є автоматизація масового введення паперових первинних документів, завантаження даних в інформаційну базу. Основна відмінність масового введення документів від простого сканування полягає в тому, що обробляється велика кількість однотипних документів. В якості прикладів додатків цієї технології в конкретних предметних областях можна привести систему введення і обробки «Платіжних доручень» у банку, систему введення «Податкових декларацій», систему введення і перевірки бухгалтерських документів в пенсійному фонді.

Для організації обробки великої кількості паперових документів і перекладу їх в електронну форму необхідно розробити систему масового введення документів (СМВ), яка буде здатна працювати як з одним, так і з декількома тисячами паперових документів в день. При проектуванні системи введення паперових документів виконується наступна сукупності операцій:

визначення складу операцій, яка повинна виконувати система;

вибирання технічних засобів реалізації виконання цих операцій;

вибір і налаштування програмного забезпечення;

розробка технологічної документації.

Розглянемо зміст основних операцій автоматизованого введення паперових документів. Автоматизовані читання і введення документів включають операції, які можна об'єднати в декілька стадій :

підготовка документів до сканування;

отримання зображення документу;

розпізнавання і введення даних, що містяться в документівИБ.

1. Підготовка документів до сканування- дуже важлива фаза процесу введення документів, яка забезпечує отримання достовірних від сканованих зображень, що зберігаються в системі, і включає дві операції: безпосередню підготовку документів для сканування і виконання опису на будівництва системи на конкретну форму документу.

Підготовка документів для сканування припускає виконання наступних кроків :

•визначення самого документу для сканування;

•вибір конкретних областей документу для сканування;

•визначення технологічного ланцюжка руху документу до сканування;

•безпосередня підготовка документів для сканування: відкриття конвертів, видалення скріпок або інших предметів, що заважають скануванню;

•підготовка пакетів документів для сканування. Складання опису кожного документу припускає виконання трьох операцій :

•складання налаштування форми документу;

•налаштування моделі введення;

•налаштування полів форми документу і індексації бази даних.

У основі виконання цього складу операцій лежить поняття форматованого (структурованого) документу (ФД). Типовими прикладами документів, що форматуються є «Платіжні доручення», «Прайс-листи» «Декларації про прибутки», «Рахунки» і так далі. Основною структурною одиницею документу, що форматується, є поле документу. Кожне поле описується в двох аспектах: візуально, зокрема геометрично, і містячи тільний. З образотворчої точки зору кожне поле має бути явно відособлене: порожніми проміжками, розділовими лініями, оригінальним типом шрифту, рівнем фону, кольором і так далі

Змістовна частина характеризується призначенням поля, словарним і алфавітним складом, а також деякими законами побудови тексту, наприклад, в полі поштової адреси повинні бути зведення про місто, вулицю, будинок

Геометричні і змістовні характеристики полів можуть бути як абсолютно незалежними, так і взаємосвязаними. Наприклад, в прибутковому ордері поряд з полями «кількість» і «ціна» знаходиться поле «сума».

Документи, які підлягають скануванню, можуть бути об'єднані в групи за декількома ознаками. За способом нанесення інформації можна виділити документи, в яких використовуються мітки, друкарський, рукописний текст. Так, наприклад, виборчі бюлетені використовують міточний спосіб, тоді як Прайс-листи - друкарський, а первинні бухгалтерські документи - в основному рукописні.

По геометричній варіантності полів розрізняють документи, в яких розташування усіх полів і записів строго фіксірованні відносно опорних елементів : рамок, ліній, постоялих надрукованих записів, спеціальних маркерів. Усе спеціально підготовлені для машинної обробки документи мають цю якість. Іншим типом є документи, які мають довільне розташування полів.

Крім того, можна розділяти документи по наявності явних роздільників полів, які часто є присутніми в таблицях, бухгалтерських документах і в платіжних дорученнях, або їх відсутності.

2.Напів паперове зображення документу - включає виконання таких операцій, як сканування; контроль якості відображень, що сканують, і можливе повторне сканування.

Сканування - це дуже відповідальна операція, отже, до вибору конкретної моделі сканера необхідно підходити досить відповідально. При виборі слід враховувати наступні чинники: розміри документів, їх стан, також чи є документ одностороннім або двостороннім, щільність роботи сканерів, необхідний дозвіл зображення, надійність отримуваних зображень.

•персональні - низько швидкісні (20-40 рядків/мін.

•настільні офісні - середньо швидкі (40-60 рядків/мін або 80-120 зображень в хвилину.

•високопродуктивні потокові (90-185 сторінок/мін або 180-370 зображень в хвилину.

За якістю сканування, залежного від дозволенної здібності, їх можна розділити на наступні групи:

•з низькою роздільною здатністю дюйм);

•з середньою роздільною здатністю (600-800 точок/1 дюйм);

• з високою роздільною здатністю (1600-2800 точок/ дюйм);

• спеціального призначення.

Для введення старих документів застосовують сканери спеціального призначення з вакуумним притиском документів, які пред'являють дуже низькі вимоги до документу і обробляють його в щадному режимі. Такі сканери дозволяють сканувати не повністю розкриті книги і документи поганої якості. Швидкість введення у таких пристроїв 0,25-3 сторінки в(хвилину.

Контроль якості від сканованих зображеньпотрібний для того, щоб усі потрібні документи були від скановані і легко читані (не повинно бути пропущених сторінок, неякісних зображень і так далі). Для підвищення ефективності і надійності системи слід мати можливість вибіркової перевірки якості від сканованих зображень, а при скануванні багатосторінкових документів - можливість відстежувати порядок сканованих сторінок.

Повторне скануванняпроводиться у разі незадовільного якості зображення або через проблеми, пов'язані з неправильним порядком сторінок в документі.

3. Розпізнавання і введення даних, що містяться в документі, в інформаційну базуприпускають виконання наступних основних операцій :

• попередньої обробки зображень;

• знаходження полів (сегментація документу і читання тексту);

• перевірки розпізнаної інформації;

• введення даних в інформаційну базу.

Попередня обробка зображеннядокументів використовує наступні спеціальні функції:

• очищення зображення застосовується для зняття з зображення окремих елементів (наприклад, точки, плями);

• зняття фону і виділень (наприклад, з цінних паперів);

• вирівнювання зображення для наступної його обробки з метою поліпшення якості розпізнавання, щоб документ показати в строго вертикальному положенні в процедурі розпізнання без перекосів;

• зняття елементів форм (для того, щоб ефективно обробляти форму, необхідно видаляти із зображення елементи форми: лінії, розграфлені, таблиці і так далі);