Следующее важное понятие – окружение (анг. – environment, position). Окружение элемента – это соседство в акте речи других элементов. Окружения могут быть различными, могут иметь произвольную длину. Так в непосредственное окружение элемента х входят элементы, предшествующие ему (ах, bах и т.д.), или следующие за ним (хс, хсd и т.д.). Полное окружение х включает весь набор элементов в данном высказывании (ахс или bахсd).
Дистрибуция или распределение (анг. distribution) элемента – совокупность всех окружений, в которых он встречается в речи. Дистрибуция представляет собой сумму всех позиций элемента относительно встречаемости других элементов.
О двух (или более) высказываниях или признаках говорят, что они лингвистически, дескриптивно или дистрибутивно эквивалентны, если они идентичны по составу элементов и дистрибутивным отношениям между элементами.
Понятие окружения и дистрибуции коррелятивны между собой так же, как сегмент и элемент. Подобно тому как элементы получаются в результате отождествления эквивалентных сегментов, дистрибуция есть результат типизации всех окружений данного элемента. Процедуры выявления элементов проводятся параллельно с процедурами определения дистрибуций. При этом осуществляется последовательный переход с одного шага анализа на другой и обратно. Учитывая это обстоятельство, можно дополнить схему:
к.а.р. высказывание сегмент элемент окружение дистрибуцияПонятия окружения и дистрибуции при нестрогом употреблении терминов часто смешивают друг с другом и отождествляют.
Однако между понятиями дистрибуции и окружения имеется существенное различие: объектами в анализе окружений являются элементы, связанные конъюнкцией (отношением одновременного вхождения – «и»); объектами в анализе дистрибуции являются сами окружения, связанные дизъюнкцией (отношением выбора – «или»). Так, в приведенном примере непосредственное окружение | д | составляет последовательность # | -ъ |. Это окружение, наряду со многими другими входит в дистрибуцию | д |:
# - ъ | дърога |
# - у | дума |
# - р | драка |
Таким образом, дистрибутивный анализ строится на основе синтагматических отношений между элементами. Однако его результаты касаются выделения классов эквивалентных элементов, т.е. охватывают область парадигматики языка.
Основные экспериментальные приемы, применяемые в дистрибутивном анализе:
Ю.Д. Апресян выделяет следующие приемы:
1) Добавление элементов к данной форме.
Например, в английском языке из-за омонимии предлогов и наречий типа up, in, on и др. довольно трудно решить вопрос о грамматической природе этих элементов. Возьмем два предложения shewasbroughtupbyhergrandmother - «она была воспитана бабушкой» и sheisgoingupthehill – «она поднимается в гору». Для того чтобы определить, в каком предложении up является предлогом, а в каком наречием, необходимо поставить между глаголом и спорным элементом качественное наречие и проверить, получается ли в результате правильная фраза. Правильность фразы диагностирует предлог (sheisgoingquicklyupthehill – «она быстро поднимается в гору»), а неправильность – наречие (shewasbroughtbadlyupbyhergrandmother).
2) Опущение элементов из данной формы.
Например, можно опустить косвенное дополнение, которое менее тесно связано с глаголом, чем прямое; прямое же дополнение опускать нельзя: Martincausedmepain - «Мартин причинил мне боль» ®Martincausedpain - «Мартин причинил боль», но не Martincausedme – «Мартин причинил мне».
3) перестановка элементов данной формы.
Возможность перестановки двух простых предложений в составе сложного указывает на наличие связи сочинения между ними, а невозможность такой перестановки свидетельствует о подчинительном характере этой связи.
Им можно, а вам нельзя ® Вам нельзя, а им можно.
НО: Она подумала, что собака убежала ® Собака убежала, что она подумала.
4) Субституция (замена) элемента другим элементом.
Для построения классов (частей речи, словоформ) используется принцип субституции: два элемента входят в один класс, если они способны замещать друг друга в одних и тех же окружениях без нарушения правильности данной фразы. Два элемента x1 и x2 считаются эквивалентными, если для любой правильной фразы вида A1x1A2 существует правильная фраза вида A1x2A2, и наоборот.
В зависимости от того, что считается элементом, окружением элемента и правильной фразой, субституция дает более или менее дробные классы: чем ближе к текстовой единице элемент и его окружение и чем жестче ограничения на правильность фразы, тем более дробными получаются классы. Например, возьмем фразу я читаю книгу. Здесь x1 является слово читаю, которое мы можем заменить на слова беру, открываю и т.д., т.е. на x2: я беру книгу; я открываю книгу.
Аналогично мы можем заменить x1 на x2 и в словах: т…м ( вместо многоточия мы можем поставить или о, или а и т.д.)
В классической дистрибутивной лингвистике в качестве элементов рассматриваются основы, их окружением считаются грамматические морфемы или классы основ и грамматических морфем, а на правильность фраз налагаются жесткие ограничения.
При замене одного элемента другим нельзя забывать о согласовательной связи: это любая синтаксическая связь между существительным и согласуемым словом, при которой форма согласуемого слова зависит от выбора существительного или от формы, в которой оно стоит. Помимо атрибутивной и предикативной связи, к этому типу синтаксический связи относятся а) связь через предлог из (один из людей, но одна из девушек);
б) связь через глагол (эту затею считают безнадежной, но это дело считают безнадежным);
в) связь со словом «который» в придаточном предложении (дело, в котором, но статья, в которой) и др.
Таким образом, через согласовательную связь определяется ключевое понятие согласовательного класса, т.е. такая совокупность существительных, что любые два ее члена, будучи взяты в любой грамматической форме, требуют при любом типе согласовательной связи одной и той же словоформы любого согласуемого слова.
5) Метод непосредственных составляющих (НС).
Метод НС используется для получения синтаксической информации.
Метод НС основан на следующих содержательных допущениях: 1) существенную роль в синтаксической структуре предложения играет одно единственное отношение – отношение подчинения; 2) предложение не собирается непосредственно из словоформ, но строится последовательно, иерархически: элемент, его части соединяются в простые, «строительные» блоки, из этих блоков строятся более крупные блоки, пока все предложение не будет представлено в виде единичного блока; 3) верхом иерархии является сказуемое, или группа подлежащего и сказуемого.
В ходе анализа устанавливаются как единичные предложения, так и отношения между ними.
Для дальнейших определений, Ю.Д. Апресян вводит понятие ранга. Пара символов XY является синтагмой первого ранга, если в любой содержащей ее правильной конструкции она может быть заменена без нарушения правильности конструкции символом Y, а Y заменен парой XY. Возьмем предложение
AnNnVDAaNa
В данном примере синтагмой первого ранга можно считать пару символов DAn(очень красивое платье), которую можно заменить на An (красивое платье). Синтагмой n-ого ранга называется пара символов XY, если в любой правильной конструкции, где X не входит в состав синтагмы (n – 1)-го ранга, она заменима символом Y, и наоборот. X и Y – непосредственные составляющие синтагмы, причем Y – ядро, X – зависимый элемент. Благодаря этому можно установить синтаксические связи между словоформами и иерархию связей. В приведенном выше примере синтагмами являются AnNn, DAa, NnV и др., причем главным является 2-ой элемент, а зависимым – 1-ый. Каждая синтагма по своим внешним синтаксическим свойствам эквивалентна ядру, взятому в отдельности. Анализ по НС называется свертыванием:
D+Ax®Ax
Ax+Nx®Nx
Результирующий элемент предыдущей синтагмы является НС следующей синтагмы, т.е. более простая синтагма может вкладываться в более сложную, выступая в качестве НС последней.
Существует несколько правил свертывания по НС: 1) одновременно можно свертывать не более двух символов в один новый; 2) запрещается перестановка символов; 3) порядок применения правил фиксирован.
Весь процесс анализа предложения (свертывания по НС) может быть изображен тремя способами: в виде правил подстановки, в виде скобочной записи и в виде дерева НС.
Однако эта модель имеет много недостатков: 1) в ряде случаев приводит к грубейшим решениям, поскольку не дает возможности фиксировать различия в синтаксической структуре предложений. Возьмем два предложения:
Изучение событий становится интересным
Развитие событий становится интересным.