Смекни!
smekni.com

възникване, определение и функции 9 (стр. 27 из 32)

Синтактическият разбор също влиза като съставна част в
такъв метод на анализ, но дърво на разбора не се прави. Напро-
тив, формират се концептуални репрезентативни структури на
цялата изходна информация, които се акумулират в текстова
база от знания. Като такива структури могат да бъдат използ-
вани формулите на логиката на предикатите или семантична
мрежа, набор от фрейми. По този начин и при двата метода
задачата за формирането на кратко изложение за автоматизи-
раното рефериране се разбива на две: представяне на текста
под формата на неговото формално описание (след което става
изборът на ключовото, основното в текста) и обратната задача
- генериране на правилно построяване на текста на естествен
език. При автоматизираното рефериране е много важно да се
вземе решение какви знания, изложени в текста, са важни и
какви могат да се изпуснат.

145


Автоматизираният машинен превод не е традиционна услуга
за системата на библиотечно-информационното обслужване. Но
по своята същност тази задача може да бъде отнесена към биб-
лиотечната сфера - да се предостави на потребителя подходя-
ща информация в подходящ вид. Най-перспективен в настоя-
щия момент е методът за решаване на тази задача, аналогичен
на метода на автоматизираното рефериране. Първо на текста,
който ще се превежда, се прави синтактичен разбор и той се
представя под формата на негово формално описание. След това
върху основата на това формално описание се генерира текст
на нужния език.

Състоянието на работите по автоматизация на реферирането
може да се характеризира по следния начин:

1. Създаването на машинни реферати се основава на извлича-
не на отделни изречения от текста на първичния документ.

2. Автоматизираното рефериране се основава на статистически
критерии; разкриване на ключови думи в текста; честота на сре-
щаните думи в заглавието и в подзаглавията на документа; на-
личие на определени елементи в изреченията, разположени в
началото или в края на параграф, раздел и т. н.; логически връз-
ки между изреченията в текста.

3. Съществуващите методи за автоматизирано рефериране още
не могат да бъдат признати за удовлетворителни.

4. Най-перспективен подход поне засега е лингвистичният, при
чието усъвършенстване се цели използването на перифразиран
текст и изучаване ролята на контекста в определени информа-
ционни концепции.

5. Основно направление на работите по автоматизираното ре-
фериране ще бъде семантичният анализ на текста. В Японския
център за научна и техническа информация (JICST) е разрабо-
тена нова система NAISS за поддържане процесите на рефери-
рането и в частност за поддържане създаването на БД и опера-
циите по вкарването на информацията. Целта на системата е
процесите да станат по-системни, да се подобри ефективността

146


на труда и да се повиши качеството на БД, да се ускори подго-
товката на рефератите и да се съкратят разходите.

В заключение можем да кажем, че по проблемите на автома-
тизираното рефериране се работи в различни страни и институ-
ции, но поради сложността на проблема постигнатите резулта-
ти са все още незадоволителни.

8.3 Видове реферативни бази от данни. Електронни
версии на реферативните издания

Реферативните {abstract database) или по-точно казано биб-
лиографско-реферативните БД освен библиографското описа-
ние на включените публикувани и непубликувани документи
по тематичен обхват на съответната база съдържат и реферати
на документите. По този начин потребителят получава по-доб-
ра представа за тяхното съдържание и може да подбере по-точ-
но необходимата му информация. Голяма част от тези БД са
електронни версии на реферативните издания.

Реферативните БД могат да се разделят по организационно-от-
раслов признак на следните две големи групи:

- реферативни БД, обхващащи много области на знанието,
наречени политематични. Типични представители на тази гру-
па са електронните версии на реферативните списания на ВИ-
НИТИ и френското списание Bulletin Signalitique, на рефератив-
ните патентни бюлетини от различни страни, на международ-
ните патентни организации. Реферативните списания на ВИ-
НИТИ са с информативни реферати, докато френското е с ин-
дикативни;

- реферативни БД, обхващащи само една област на знанието,
наречени тематични или специализирани. Типични предста-
вители на тази група са Chemical Abstracts, издание на Дружест-
вото на американските химици, чийто хартиен носител излиза
от 1907 г. с информативни реферати; Biological Abstracts на
Американската асоциация на биолозите с начална дата 1926 г.,

147


съдържащо информативни реферати из областта на биологиШ
та; Physics Abstracts, издание на Института на електронни!!
инженери в Лондон, излязло за първи път през 1898 г., чия-nji
електронна версия съдържа индикативни реферати в областш
на физическите науки; Physikalische Berichte, издание на немЦ
ските физически дружества от 1920 г. с индикативни рефератЙ|
в областта на физическите науки.

От всички БД в света (над* 9000 към 2003 г.) около 37 % са|
реферативните БД (Computer, 2005). Най-реномирани и най-из-|
ползвани в световен мащаб са следните политематични БД, спе-!
циализирани в отделни области на знанието (Петков, 1996):

У BIOSIS Previews е библиографско-реферативна БД за ста-,<
тии в периодични издания, доклади от конференции, отчети от.
НИР, патенти и други документи по различни аспекти на био-
логията];

> Dissertation Abstracts online е БД за всички дисертации,
защитени в университетите на САЩ, както и за хиляди дисер-
тации в Канада. БД съдържа и информация за защитени ди-
сертации в Европа след 1987 г.;

> INSPEC - БД в областта на електротехниката и електрони-
ката, която съдържа информация, отговаряща на съдържанието
на печатните реферативни издания Physics Abstracts, Electrical
& Electronics Abstracts, Computer & Control Abstracts, Business
Automation;

> Energy Science & Technology е реферативна БД за световна-
та литература по изследователската и технологичната дейност
в областта на енергийните източници;

> PTS PROMPT съдържа реферати и отчасти пълните тек-
стове на 1200 периодични издания в областта на икономиката;

> ABI/INFORM отразява реферати на повече от 1000 рено-
мирани икономически и търговски периодични издания;

> Trade & Industry Index отразява съдържанието на повече от
300 основни списания с тьрговско-икономическа тематика;

> MathSci съдържа реферативна информация в областта на

148


математиката, компютърната наука, статистиката, иконометри-
ята, информационните системи;

> EMBASE съдържа информация по биомедицина, биохи-
мия и фармакология, лекарствени средства. БД се захранва от
над 3500 списания, издавани в около 110 държави;

> MEDLINE покрива всички аспекти на медицината;

> METADEX обхваща литература от 43 страни по научни и
практически въпроси на металургията;

> Information Science Abstracts предоставя реферати в след-
ните области: библиотечно и информационно обслужване; съз-
даване, възпроизвеждане и разпространение на информация;
съхраняване и автоматизирано търсене на данни; използване
на информацията; приложение на други научни дисциплини в
информационното обслужване;

> NTIS съдържа реферати на публикации за разработки, фи-
нансирани от американското правителство от 1964 г. насам;

> COMPENDEX обхваща реферати на статии по всички ин-
женерни дисциплини;

> Chemical Abstracts е онлайн версия на едноименното печат-
но реферативно издание. Обхваща списания, патенти, техни-
чески отчети, книги, доклади от конференции и дисертации в
областта на химията;

> INIS съдържа реферати за статии от 7600 списания, отчети
за НИР, материали от конференции, книги и патенти в областта
на атомната енергия, атомните реактори и тяхната надеждност;
приложение на радиоактивните изотопи в медицината, селско-
то стопанство и промишлеността; екологични, икономически и
здравни аспекти на атомната енергия;

> STANDARDS INFODISK съдържа както стандарти на 38
европейски страни, асоциации, комитети, дружества, институ-
ти, така и на 80 различни американски организации. Освен това
са включени стандартите на ISO, IEC, JIS (японски стандарти),
SA (австралийски стандарти), CS А (канадски стандарти), стан-
дарти на НАТО;

149


> PERINORM e реферативна БД за френски, английски и гер-
мански стандарти, както и на международни и европейски стан-
дарти и стандартите на още 10 страни - САЩ, Япония, Авст-
рия, Швейцария, Холандия, Турция, Белгия и др.

Първите печатни научни списания се появяват през 1665 г. -
220 години след изобретяването на печатарския стан. Елект-
ронните версии възникват само 20 години след като електронните
публикации доказаха своята жизнеспособност и започнаха да се
обсъждат варианти за електронен достъп до тях. Първите печатни
списания позволиха да се води хроника за развитието на науката,
изобретателството и научните изследвания, което се прави и досе-
га. Още тогава технологията на книгопечатането се е сторила на
учените толкова чудесна и революционна, каквато е в очите на
днешните изследователи електронната технология.

През 1970 г. в света на списанията се появява новост - някол-
ко списания започват да излизат на компютърни ленти и гъвка-
ви дискове. Но има проблеми. Абонатите на тези нови списа-
ния трябва да имат компютри от един и същи тип и да ползват
един и същи компютърен език, както и издателството. Усъвър-
шенстването на програмното осигуряване помага да се избег-
нат тези трудности. Ерата на електронните списания настъпва
наистина в началото на 90-те години на миналия век и предиз-
виква революция в производството на серийни и реферативни
информационни издания (Larson, 1976).