При реализирането на алгоритъма съществената информация
се извлича от текста. При реферирането се предполага използ-
ването на индивидуалните особености на референта, на негово-
то знание, опит, цели и задачи за написването на реферата. При-
лагането на този алгоритъм е необходимо и поради следния
факт. Съвременната структурна лингвистика утьрждава, че
научно-техническите текстове притежават излишък, който дости-
га понякога до 75 %. Практически само 25 % от обема на текста
носят основния смисъл. Алгоритъмът помага да се съсредоточи
вниманието при обработването само върху съдържателния обем
на текста. При неговото използване значително се съкращава
времето за осмисляне на неинформативните елементи на текста
и останалият текст се възприема по-ефективно.
Фиг.4. Блок-схема за извличане на смисъла и значението на текста |
31 |
Равнище на свиване
Процедурите по съставяне на реферата могат да се сведат до
общо запознаване с реферирания документ, зада се оцени него-
вата тематика, съдържанието, предназначението, читателският
адрес; структурата, оформянето, обема и други и формиране на
представа за него.
По-подробно процедурите можем да посочим в следната после-
дователност:
1) изчитане на документа и разкриване на съществените еле-
менти на неговото съдържание, конкретните факти на новото и
на полезното в него;
2) анализиране на подбраните и маркирани пасажи от текста
и определяне на основните аспекти, които ще бъдат разкрити в
реферата;
3) построяване на схемата на синтеза на информацията и струк-
турата на реферата;
4) написване на реферата и редактиране на неговия текст.
На фиг. 5 е даден модел на процеса на реферирането (Кулик,
1981).
Можем да отбележим, че в процеса нааналитико-синтетична-
та преработка на първичния документ референтът се ползва от
32
следните свои знания: знания за постиженията в конкретната
област, знания за изискванията на информационните потреб-
ности, знания за изискванията към реферирането.
Фиг. 5. Модел па процеса па рефериране |
33 |
В резултат на четенето на текста на документа (блок 1) се раз-
крива неговата семантична структура, т. е. интерпретира се съ-
държанието на първичния документ. Тази семантична структу-
ра се подлага на по-нататъшен анализ (блок 2): избират се основ-
ните елементи на съдържанието на първичния документ и се
отстраняват несъществените и малко съществените сведения.
По време на тази операция референтът се "обръща" към своите
знания и решава кои сведения от първичния документ смята за
основни и кои за второстепенни. При тази операция става нала-
гането на тезауруса на референта с този на реферирания текст.
По този начин се формира основното смислово съдържание на
първичния документ, което при операцията синтез (блок 3) се
оформя във вид на реферат (Кулик, 1981).
Ще се спрем подробно на оценката на информативността.
Информстшвиостта е съвкупност от най-съществената инфор-
мация, съдържаща се в отделното съобщение. Количествената
оценка на информативността на вторичните документи е при-
емлива предимно за рефератите, които в сравнение с анотации-
те и библиографските описания по-точно отразяват същността
на семантичната структура на първичния" документ.
Най-простият метод за определяне на информативността на
реферат I се състои в изчисляване по формулата
I=N/D, (1)
където N - брой на елементите в съдържанието на реферата,
единици;
D - брой на елементите в съдържанието на първичния
документ.
Както знаем, процесът на създаване на реферата се съпровож-
да от съкращаване на обема на първичния документ. Показате-
лят за съкращаване на обема - коефициент на свиване С, се
изчислява от съотношението
С= P/L, (2)
където Р - дължината на реферата в думи, а
L - дължината на първичния документ в думи.
Информативността на реферата като мярка за предаване на
адекватността на съдържанието на първичния документ пред-
полага едновременно и съкращаване на обема на първичния
документ. Съдържателната структура на реферата е правомер-
но да се оценява с два показателя - информативност и степен
на свиване. Взаимовръзката на тези параметри се изразява чрез
показателя относителна информативност
34
G=I/C . (3)
При използването на този показател следва да се има пред-
вид, че съкращаването на текста е регламентирано от структур-
ните особености на езика. Същността на съдържанието на ка-
къвто и да е първичен документ без загуба на информация се
предава при условие, че коефициентът на свиване се намира в
диапазона 0.2 d" С d"l.
При I = 0,7 съдържанието на реферата се състои от седем еле-
мента на първичния документ от фактически десет, а С = 0,15
означава, че обемът на всичките седем предавани елемента на
съдържанието е съкратен до 15 %. Реферат с относителна ин-
формативност G = 4,66 теоретически престава да изпълнява
функциите на реферат и преминава в групата на анотациите.
При I = 1,0, а С = 0.3 се смята, че рефератът притежава пределна
информативност и достатъчно обстоятелствено предава същност-
та на съдържанието на първичния документ.
В таблица 2 е показан типов модел на семантична структура
на документ.
35 |
Таблица 2
Типов модел на семантична структура на документ
(4)
където К - тегловен коефициент;
d- брой на елементите от I група, отразени във вторич-
ния документ;
D{ — брой на елементите от II група на първичния документ.
Информативността като мярка за оценка на съдържанието на
документа не отчита факторите, влияещи върху възприемането
на текста от потребителя. Достъпността и разбираемостта на
текста се оценяват чрез комплексното понятие чептвност. Това
понятие се разглежда от позициите на два основни аспекта -
структурен (формат на текста, тип на шрифтовете, графики и т.
н.) и езиков (интерес у читателя към текста в зависимост от
стила на изложението, речниковия запас и други лингвистични
особености). Методите за оценка на четивността се базират най-
вече върху езиковия аспект на изследване. Оценката на четив-
ността от позициите на структурния аспект носи доста индиви-
дуален характер. В основата на методите обикновено стоят фак-
тори като речников състав, структура на изреченията и насите-
ност на текста.
2.3 Методи за рефериране на документи
Необходимостта от висококвалифициран подход към подго-
товката на рефератите е отчетена още от М. В. Ломоносов, кой-
то отбелязва, че "който се наема да съобщава на публиката съ-
държанието на новите съчинения е длъжен да се съобрази със
своите сили, защото той се захваща с тежък труд и доста сло-
36
жен чиято цел е не в това да предава известни и общи истини,
а да умее да обхваща новото и същественото в съчиненията,
принадлежащи на хора, понякога и много гениални" (Михай-
лов, 1976). С тези думи най-точно се показва необходимостта
от възникването на специална наука за реферирането.