Національний Університет
“Києво-Могилянська Академія”
Департамент комп’ютерних технологій
Кафедра інформатики
Гіпертекст як засіб нелінійної репрезентації тексту
Реферат з курсу
“Лінгвістичне забезпечення інтелектуальних систем”
Студента V курсу ДКТ
Кравченка Івана Олександровича
Керівник: доц. І. Б. Штерн
Київ, 2000
3. Гіпертекст як форма організації інформації5
4. Гіпертекстова технологія. 7
Властивості ідеалізованої гіпертекстової системи. 11
Основні критерії для оцінки потужності гіпертекстових систем. 12
6. Недоліки і проблеми гіпертекстових систем. 12
7. Гіпертекст - інструмент представлення знань. 13
1. Вступ
Гіпертекст - сучасна інформаційна, комп'ютерно-підтримувана технологія організації текстових, графічних, відео- та звукових матеріалів, а також їх споживання, що відзначається двома особливостями:
1. в ній поєднуються нелінійний, асоціативно - фрагментарний та сітковий принципи репрезентації інформаційного середовища;
2. формування та вилучення потрібної інформації здійснюється шляхом вільної навігації за нелінійними зв'язками, зафіксованими в гіпертекстовому середовищі.
Сучасний стан розвитку інформаційних технологій, зокрема, операційні системи типу Microsoft Windows, MacOS, XWindows, а також прикладні програмні продукти, які створені для них, мають риси, які свого часу були описані дослідниками гіпертексту. Віконний інтерфейс, маніпулятор “миша”, панель завдань та інші “звичні” для користувача речі було винайдено при проектуванні першої гіпертекстової комп’ютерної системи ще в 1963-у році.
Розвиток всесвітньої мережі INTERNET, а точніше інформаційний бум, який не спадає впродовж останніх років, нерозривно пов’язаний з World Wide Web (WWW) – першою інформаційною гіпертекстовою службою планетарного масштабу. Кількість і доступність інформації помножені на зручність гіпертекстової організації цієї величезної бази даних зробили так, що велика кількість людей вже не уявляють своє повсякдення без INTERNET.
Гіпертекст як технологія, з його інтуїтивно зрозумілими, наближеним до людського способу мислення інтерфейсом, став одним з найефективніших способів представлення інформації. Ідеологія гіпертекстового представлення інформації дедалі поширюється не тільки на енциклопедичні знання, але й на спосіб організації інтерфейсу будь-якого сучасного програмного продукту, від іграшки до системи банківського обліку.
В цій роботі зроблено спробу сумувати сучасні знання про гіпертекст, його історію, складові частини, напрямки розвитку та сфери застосування.
Першим, хто глибоко усвідомив недосконалість традиційних методів роботи з усілякими носіями інформації (звітами, планами, програмами, довідниками, енциклопедіями, книгами й ін.), а також недосконалість і самої форми організації цих носіїв, був Буш, науковий радник президента Рузвельта. Під час другої світової війни він виконував обов’язки директора Управління досліджень і розробок США і відчував величезне інформаційне перевантаження при контролі діяльності 6000 вчених, які працювали на оборону країни. Буш передбачав інформаційний вибух. У 1945 р. він зазначав, що існуючі методи представлення і перегляду результатів досліджень цілком неадекватні задачам, які постають перед користувачем. Він наголошував, що складності при пошуку необхідного запису частіше усього виникають через штучність побудови самої пошукової системи. Як правило, дані всіх типів заносяться в пам'ять відповідно до алфавітного або числового порядку, і інформація відшукується шляхом перегляду поверх униз підкласу за підкласом. Крім того, досягнувши необхідного елемента, користувач повинний вийти із системи і знову включитися в неї, щоб пройти вже новим шляхом.
Буш звертав увагу на те, що людський мозок працює інакше, а саме на основі асоціацій. Затримуючись на одному предметі, він швидко перестрибує на інший, запропонований асоціацією думки. Щоб відбити в комп'ютері цей процес, потрібні спеціальні засоби для встановлення зв'язку й звертання до асоційованого предмета.
Буш не побачив утілення своїх ідей при житті, але ввійшов в історію як піонер гіпертексту, який усвідомив значення нелінійного пошуку для інтелектуальної роботи і запропонував пристрій для реалізації такого пошуку - машину МЕМЕХ. Вона передбачала нелінійне, багатоаспектне впорядкування інформації та використання процедур асоціативного поглядання пов'язаних між собою даних.
У задумі Буша відбилися основні риси гіпертекстових систем: зберігання тексту разом із графічними компонентами, включення в базу даних власних матеріалів, перегляд інформації за зв'язками, перехід від фрагмента до фрагмента одним натисненням кнопки, формування шляхів у гіпертексті.
Термін “гіпертекст” увів Нельсон і визначив його як комбінацію природно-мовного тексту зі здатністю комп'ютера здійснювати інтерактивне розгалуження або динамічне відтворення нелінійного тексту, який не може бути надрукованим у звичайний спосіб на аркуші паперу. Нельсон відзначав: “Звичайний лист є послідовним..., тому що він... походить від мови. Проте структура думок не послідовна. Вони постійно переплітаються одна з одною, і коли ми пишемо, нам завжди хочеться зв'язати думки не послідовно”.
В одній зі своїх ранніх книг “Інформаційні системи майбутнього” він писав: “Гіпертекст може відрізнятися від звичайного тексту порядком проходження матеріалу (елементи гіпертексту можуть розміщуватися у вигляді ієрархічного дерева або сітки, він може мати декілька рівнів стислості викладу і деталізації матеріалу), засобом його представлення (використання матеріалу може забезпечити відтворення рухливих ілюстрацій) і т.д.”.
Ідеї Буша і Нельсона розвинув Енгельбарт. У 1963 р. під його керівництвом було розроблено першу комп'ютерну гіпертекстову систему NLS (oN Line System). У процесі її розробки Енгельбарт винайшов ряд пристроїв і концепцій, які ввійшли в сучасний арсенал обчислювальної техніки: маніпулятор типу “миша”; багатовіконний інтерфейс; акордову клавіатуру; текстовий редактор і контекстно-дошкульна підтримку.
Багато програмних продуктів (наприклад, продукти Microsoft Windows) мають риси гіпертексту (ГТ) - це, як правило, гіпертекстоподібний інтерфейс. Проте ГТ як технологія має більші можливості.
У СРСР роботи, які були пов'язані з нелінійним представленням тексту, природно в повній безвісності щодо самого терміна “гіпертекст”, велися різними авторами ще в 50-ті роки. Це роботи, які одержали назви “логіко-значеннєвий метод”, роботи з “структури і синтаксису зв’язаного тексту”, ідеологія текстових виражень і її реалізації в ЕОМ серії МІР.
В 90-их роках сформувався великий інтерес до гіпертексту. Прийшло усвідомлення величезних можливостей цієї технології для представлення, осмислення і прогнозування об'єктів дослідів. Результати останніх років перевершили всі очікування. Використання систем гіпермедіа, мультимедіа - новий якісний стрибок в розвитку інформаційних технологій.
3. Гіпертекст як форма організації інформації
У літературі термін “гіпертекст” (ГТ) використовується найчастіше як для позначення об'єкта дослідження, так і технології дослідження. Як об'єкт ГТ являє собою сітку, в якій зв'язки між вузлами - фрагментами ГТ - проставлені самим користувачем, частіше усього по семантичній близькості фрагментів. У якості фрагментів можуть виступати тексти, формули, графічна інформація, звуко- і відеозапис, тобто довільні модулі знань. У ГТ знято всі обмеження на структуру і зв'язки між ними. Не потрібно формалізації знань. На відміну від СУБД і інформаційно-пошукових систем елементами ГТ є природні тексти, що не потребують ні індексування, ні форматування. Кожний модуль знань може бути поданий у своїй формі. Доступ до них здійснюється шляхом навігації в гіпертекстовій базі знань. Гіпертекст відкритий для поповнення і змін. У нього немає апріорно визначеної структури. Це засіб представлення заздалегідь не структурованих, вільно нарощуваних знань. Користувач власноруч формує своє інформаційне середовище. Для цього ГТ - технологія надає йому дружній інтерфейс. Завдяки такому підходу зникають багато бар'єрів між користувачем і комп'ютером або відповідною інформаційною системою. Вона перестає бути “чорним ящиком”; взаємозв'язок між елементами знань стає видимим і доступним для користувача, що може настроювати інформаційну систему на свою проблемну область.
Все це знаменує новий рівень взаємовідносин людина - система і є відповідним до інтелектуальної діяльності людини.
Серед різноманітних визначень гіпертексту найстислішим і доречнішим є таке: “Гіпертекстом називається текст, на якому задані зв'язки між виділеними в ньому елементами”.
Елементами ГТ можуть бути довільні символи (наприклад, знаки алгебраїчних операцій), слова і словосполучення, повні тексти й окремі фрази, малюнки, графіки, або їх частини тощо. Якщо до складу ГТ входить інформація різних типів (текст, ілюстрація, мультиплікація, звук, відео), то такий ГТ називають гіпермедіа (ГМ) або гіперсередовищем.
Серед різноманітних моделей ГТ (наприклад, апарат теорії графів) найпростішою і наочною є сітка, у вузлах якої записуються блоки інформації, а дуги інтерпретуються як зв'язки між блоками і виділеними в них елементами. Зв'язки можуть бути одно - і двобічними.