Пошук і фільтрація документів виробляється по запитах на основі контекстного пошуку: по атрибутах, по ключових словах і по повному змісті тексту на основі індексу. При використанні механізму чіткого пошуку (наприклад, DOCS OPEN) у запиті не повинне бути орфографічних помилок, а в тексті документа – помилок розпізнавання. При цьому може морфологічний розбір дозволяє спростити.
Недавно на основі нейронних мереж і штучного інтелекту реалізована технологія нечіткого пошуку по повному змісті документа (наприклад, технологія адаптивного розпізнавання образів APRP у пакеті Excalіbur EFS). Нечіткий пошук не вимагає повної відповідності шуканих фраз із умістом документів, крім того, виключає потреба у виправленні помилок після розпізнавання тексту. Система пошуку завжди видає користувачеві відповідь, щонайкраще погоджений з термінами або фразами запиту.
Фірми-виробники реляційних Систем Управління Базами Даних (зокрема ORACLE) проповідують інші схеми зберігання – текстові й універсальні бази даних [3]. Тексти документів зберігаються в символьних полях змінної довжини, розширені засоби SQL-пошуку дозволяють формувати змішані запити для пошуку по атрибутах і контекстному пошуку, а додаткові функції забезпечують обробку тексту. Для зберігання довільної інформації, у тому числі мультимедиа, можна використати поля бінарних об'єктів великої довжини BLOB й/або гіпертекст. СУБД, розширені для пошуку й обробки такої інформації, утворять універсальні сервера БД. Інший спосіб зберігання документів довільного змісту реалізують БД (наприклад, Іnformіx Іllustra).
Феномен розподіленого гіпертексту становить основу широко впроваджуваної Web – технології. Сховище інформації являє собою сукупність гіпертекстових сторінок, розподілених по вузлах мережі Іnternet або корпоративної мережі (Іntranet). Кожна сторінка розміщається в окремому файлі і являє собою текст, розмічений за допомогою мови HTML. Структуризація документа здійснюється шляхом форматування, виділення полів, створення форм для діалогового заповнення документа й організацією внутрішніх гіпертекстових посилань. Дозволяється створення гипермедіа включенням будь-якої інформації (растрова графіка, аудио, відео). Навігація по сховищу гіпертексту здійснюється за допомогою зовнішніх гіпертекстових посилань URL на документи, розташовані на різних вузлах мережі (Web-серверах). Крім того, для визначення місцезнаходження документів служить контекстний пошук. Для прискорення пошуку інформації в «павутині» застосовуються спеціальні програми-роботи, скануючі Web – сервера й будуючі якусь подобу індексу. Використання гіпертексту дозволяє створити інформаційну інфраструктуру територіально розподіленої установи й спростити діалоговий інтерфейс користувача, що найбільше важливо при розробці інформаційних додатків для керівників.
Організація й автоматизація в офісі колективної роботи з документами будуються на технологіях groupware й workflow.
Технології groupware орієнтовані на невеликі робочі групи, характеризуються підтримкою виконання одного колективного завдання й відсутністю структуризації в організації робіт. Підтримка обмежується забезпеченням колективного доступу до інформації за допомогою різних методів доступу:
· мережний доступ до файлів і бази даних;
· локальна й глобальна електронна пошта (включаючи конференції й дискусії);
· термінальний доступ, пересилання файлів й електронна дошка оголошень;
· перегляд й інтерпретація гіпертексту (гипермедиа).
Потрібно відзначити, що Web-технології крім гіпертекстового протоколу HTTP містять у собі ряд інших методів доступу.
При колективній роботі важлива наявність блокувань для дозволу конфліктів при спільному використанні ресурсів, санкціонування доступу по ідентифікаторах і паролям, захист інформації за допомогою прав доступу. Додатковий рівень безпеки забезпечується методами й засобами шифрации й електронного підпису.
Технології класу workflow існують для автоматизації документообігу в середніх і великих офісах і для них характерно:
· підтримка багатокористувачевої роботи з декількома завданнями одночасно;
· чітка структуризація виконання робіт з ролей і документів з контролем виконання.
Діловий процес формалізується як сукупність станів і переходів, необхідних для опису взаємодії, як мінімум двох суб'єктів (в окремому випадку співробітників підприємства) для досягнення виконання заздалегідь заданої умови. Часткою случаємо такої взаємодії є просте пересилання документа із крапки в крапку.
Однієї з реалізацій технології workflow є так називана «система графів», де кожен крок являє собою вектор і відбиває рух завдання, пов'язаного з документом, або просто пересування документа від одного суб'єкта до іншого. При цьому на людину, відповідального за правильність функціонування схеми, лягає відповідальність обліку всіляких непередбачених ситуацій, які можуть виникнути на шляху руху документа. Інша реалізація ґрунтується на понятті «цикл» («loop») або «стіл». У цьому випадку мається на увазі, що найменшим елементом у схемі взаємодії є цикл, що враховує всю гаму взаємодії між двома довільними суб'єктами. При цьому система сама відслідковує замкнутість процесу й, у випадку помилки, указує місце некоректності із вказівкою її причини, після чого припиняється генерація нового процесу.
Регламентації взаємин суб'єктів документообігу доповнюється завданням безумовної й умовної маршрутизація документів (по електронній пошті) і часів обробки документа для контролю й обліку виконання.
Обробка інформації базується на методах і засобах офісної автоматизації:
·обробка тексту,
·електронні таблиці,
·ділова й презентаційна графіка,
·планування робіт і нарад,
·генерація звітів з бази даних,
·мультимедіа.
Для комплексування різних видів інформації й інтеграції пакетів програм використаються кілька методів, серед яких центральне місце займає методи OLE для зв'язування й вбудовування об'єктів.
Висновок інформації здійснюють шляхом печатка документів, публікація їх на Web – серверах, у загальних поштових папках й електронних дошках оголошень або розсилання по телекомунікаціях.
Огляд засобів автоматизації установ.
Інформаційно-програмні засоби автоматизації установ діляться на наступні категорії:
· функціональні й інтегровані пакети офісної автоматизації;
· системи для організації групової роботи;
· системи керування електронними документами;
· засоби керування документообігом.
Конкретні завдання, які повинні вирішуватися інформаційною системою, залежать від тієї прикладної області, для якої призначена система. Області застосування інформаційних додатків різноманітні: банківська справа, страхування, медицина, транспорт, утворення й т.д. Важко знайти область ділової активності, у якій сьогодні можна було обійтися без використання інформаційних систем.
Але можна виділити деяку кількість завдань, що не залежать від специфіки прикладної області.
Наприклад, можна уявити собі малу торговельну компанію зі швидким оборотом, в інформаційній складській системі якої досить підтримувати інформацію про товари, наявних на складі, і про ще незадоволені заявки від споживачів. Але ніхто не знає, не буде потрібно чи згодом повна історія роботи складу з моменту підстави компанії.
Важливим завданням, що повинне виконувати більшість інформаційних систем, – це зберігання даних, що володіють різними структурами. Важко уявити собі більш-менш розвинену інформаційну систему, що працює з одним однорідним файлом даних. Більше того, розумною вимогою до інформаційної системи є те, щоб вона могла розвиватися. Можуть з'явитися нові функції, для виконання яких потрібні додаткові дані з новою структурою.
При виконанні функцій рівня користувальницького інтерфейсу інформаційній системі самої доводиться виконувати вибірку інформації з файлів за заданим критерієм. Деякі системи керування файлами дозволяють вибирати запису за простим критерієм, наприклад, за заданим значенням ключа запису.
Відомі приклади реально функціонуючих інформаційних систем, у яких сховище даних планувалося засновувати на файлах. У результаті розвитку більшості таких систем у них виділився окремий компонент, що являє собою примітивний різновид системи управління базами даних. Саморобні СУБД – головний недолік інформаційних систем. Програміст змушений зробити просту (швидше за все, персональну) СУБД загального призначення, що може одержати з бази даних інформацію про структуру її файлів (тобто в базі даних зберігаються тепер ще й метаданні, що визначають структури звичайних даних, – схема бази даних), а також виконати довільний запит до цієї бази даних.
У корпоративних інформаційних системах по природних причинах часто виникає потреба в розподіленому зберіганні загальної бази даних. Наприклад, розумно зберігати деяку частину інформації якнайближче до тих робочим місцям, у яких вона найчастіше використається. Із цієї причини при побудові інформаційної системи доводиться вирішувати завдання погодженого керування розподіленою базою даних (іноді застосовуючи методи реплікації даних). При однорідній побудові розподіленої бази даних (на основі однотипних серверів баз даних) це завдання звичайно вдається вирішити на рівні СУБД (більшість виробників розвинених СУБД підтримує засобу керування розподіленими базами даних). Якщо ж система різнорідна (тобто для керування окремими частинами розподіленої бази даних використаються різні сервери), то доводиться прибігати до використання допоміжних інструментальних засобів інтеграції різнорідних баз даних типу моніторів транзакцій.
До компонентів інформаційної системи відносяться:
1. інформація, необхідна для виконання однієї або декількох функцій керування;
2. персонал, що забезпечує функціонування інформаційної системи;