Синтактическият разбор също влиза като съставна част в
такъв метод на анализ, но дърво на разбора не се прави. Напро-
тив, формират се концептуални репрезентативни структури на
цялата изходна информация, които се акумулират в текстова
база от знания. Като такива структури могат да бъдат използ-
вани формулите на логиката на предикатите или семантична
мрежа, набор от фрейми. По този начин и при двата метода
задачата за формирането на кратко изложение за автоматизи-
раното рефериране се разбива на две: представяне на текста
под формата на неговото формално описание (след което става
изборът на ключовото, основното в текста) и обратната задача
- генериране на правилно построяване на текста на естествен
език. При автоматизираното рефериране е много важно да се
вземе решение какви знания, изложени в текста, са важни и
какви могат да се изпуснат.
145
Състоянието на работите по автоматизация на реферирането
може да се характеризира по следния начин:
1. Създаването на машинни реферати се основава на извлича-
не на отделни изречения от текста на първичния документ.
2. Автоматизираното рефериране се основава на статистически
критерии; разкриване на ключови думи в текста; честота на сре-
щаните думи в заглавието и в подзаглавията на документа; на-
личие на определени елементи в изреченията, разположени в
началото или в края на параграф, раздел и т. н.; логически връз-
ки между изреченията в текста.
3. Съществуващите методи за автоматизирано рефериране още
не могат да бъдат признати за удовлетворителни.
4. Най-перспективен подход поне засега е лингвистичният, при
чието усъвършенстване се цели използването на перифразиран
текст и изучаване ролята на контекста в определени информа-
ционни концепции.
5. Основно направление на работите по автоматизираното ре-
фериране ще бъде семантичният анализ на текста. В Японския
център за научна и техническа информация (JICST) е разрабо-
тена нова система NAISS за поддържане процесите на рефери-
рането и в частност за поддържане създаването на БД и опера-
циите по вкарването на информацията. Целта на системата е
процесите да станат по-системни, да се подобри ефективността
146
на труда и да се повиши качеството на БД, да се ускори подго-
товката на рефератите и да се съкратят разходите.
В заключение можем да кажем, че по проблемите на автома-
тизираното рефериране се работи в различни страни и институ-
ции, но поради сложността на проблема постигнатите резулта-
ти са все още незадоволителни.
8.3 Видове реферативни бази от данни. Електронни
версии на реферативните издания
Реферативните {abstract database) или по-точно казано биб-
лиографско-реферативните БД освен библиографското описа-
ние на включените публикувани и непубликувани документи
по тематичен обхват на съответната база съдържат и реферати
на документите. По този начин потребителят получава по-доб-
ра представа за тяхното съдържание и може да подбере по-точ-
но необходимата му информация. Голяма част от тези БД са
електронни версии на реферативните издания.
Реферативните БД могат да се разделят по организационно-от-
раслов признак на следните две големи групи:
- реферативни БД, обхващащи много области на знанието,
наречени политематични. Типични представители на тази гру-
па са електронните версии на реферативните списания на ВИ-
НИТИ и френското списание Bulletin Signalitique, на рефератив-
ните патентни бюлетини от различни страни, на международ-
ните патентни организации. Реферативните списания на ВИ-
НИТИ са с информативни реферати, докато френското е с ин-
дикативни;
- реферативни БД, обхващащи само една област на знанието,
наречени тематични или специализирани. Типични предста-
вители на тази група са Chemical Abstracts, издание на Дружест-
вото на американските химици, чийто хартиен носител излиза
от 1907 г. с информативни реферати; Biological Abstracts на
Американската асоциация на биолозите с начална дата 1926 г.,
147
От всички БД в света (над* 9000 към 2003 г.) около 37 % са|
реферативните БД (Computer, 2005). Най-реномирани и най-из-|
ползвани в световен мащаб са следните политематични БД, спе-!
циализирани в отделни области на знанието (Петков, 1996):
У BIOSIS Previews е библиографско-реферативна БД за ста-,<
тии в периодични издания, доклади от конференции, отчети от.
НИР, патенти и други документи по различни аспекти на био-
логията];
> Dissertation Abstracts online е БД за всички дисертации,
защитени в университетите на САЩ, както и за хиляди дисер-
тации в Канада. БД съдържа и информация за защитени ди-
сертации в Европа след 1987 г.;
> INSPEC - БД в областта на електротехниката и електрони-
ката, която съдържа информация, отговаряща на съдържанието
на печатните реферативни издания Physics Abstracts, Electrical
& Electronics Abstracts, Computer & Control Abstracts, Business
Automation;
> Energy Science & Technology е реферативна БД за световна-
та литература по изследователската и технологичната дейност
в областта на енергийните източници;
> PTS PROMPT съдържа реферати и отчасти пълните тек-
стове на 1200 периодични издания в областта на икономиката;
> ABI/INFORM отразява реферати на повече от 1000 рено-
мирани икономически и търговски периодични издания;
> Trade & Industry Index отразява съдържанието на повече от
300 основни списания с тьрговско-икономическа тематика;
> MathSci съдържа реферативна информация в областта на
148
математиката, компютърната наука, статистиката, иконометри-
ята, информационните системи;
> EMBASE съдържа информация по биомедицина, биохи-
мия и фармакология, лекарствени средства. БД се захранва от
над 3500 списания, издавани в около 110 държави;
> MEDLINE покрива всички аспекти на медицината;
> METADEX обхваща литература от 43 страни по научни и
практически въпроси на металургията;
> Information Science Abstracts предоставя реферати в след-
ните области: библиотечно и информационно обслужване; съз-
даване, възпроизвеждане и разпространение на информация;
съхраняване и автоматизирано търсене на данни; използване
на информацията; приложение на други научни дисциплини в
информационното обслужване;
> NTIS съдържа реферати на публикации за разработки, фи-
нансирани от американското правителство от 1964 г. насам;
> COMPENDEX обхваща реферати на статии по всички ин-
женерни дисциплини;
> Chemical Abstracts е онлайн версия на едноименното печат-
но реферативно издание. Обхваща списания, патенти, техни-
чески отчети, книги, доклади от конференции и дисертации в
областта на химията;
> INIS съдържа реферати за статии от 7600 списания, отчети
за НИР, материали от конференции, книги и патенти в областта
на атомната енергия, атомните реактори и тяхната надеждност;
приложение на радиоактивните изотопи в медицината, селско-
то стопанство и промишлеността; екологични, икономически и
здравни аспекти на атомната енергия;
> STANDARDS INFODISK съдържа както стандарти на 38
европейски страни, асоциации, комитети, дружества, институ-
ти, така и на 80 различни американски организации. Освен това
са включени стандартите на ISO, IEC, JIS (японски стандарти),
SA (австралийски стандарти), CS А (канадски стандарти), стан-
дарти на НАТО;
149
Първите печатни научни списания се появяват през 1665 г. -
220 години след изобретяването на печатарския стан. Елект-
ронните версии възникват само 20 години след като електронните
публикации доказаха своята жизнеспособност и започнаха да се
обсъждат варианти за електронен достъп до тях. Първите печатни
списания позволиха да се води хроника за развитието на науката,
изобретателството и научните изследвания, което се прави и досе-
га. Още тогава технологията на книгопечатането се е сторила на
учените толкова чудесна и революционна, каквато е в очите на
днешните изследователи електронната технология.
През 1970 г. в света на списанията се появява новост - някол-
ко списания започват да излизат на компютърни ленти и гъвка-
ви дискове. Но има проблеми. Абонатите на тези нови списа-
ния трябва да имат компютри от един и същи тип и да ползват
един и същи компютърен език, както и издателството. Усъвър-
шенстването на програмното осигуряване помага да се избег-
нат тези трудности. Ерата на електронните списания настъпва
наистина в началото на 90-те години на миналия век и предиз-
виква революция в производството на серийни и реферативни
информационни издания (Larson, 1976).