Смекни!
smekni.com

Дистрибутивный анализ (стр. 5 из 6)

Подготовка процедуры состоит в установлении окружений элементов и их суммировании.

Рассмотрим эти процедуры на примере. Пусть даны следующие высказывания: | разб’ила |, |бы |, | был |, | быт |, | б’ит’ |, | иба |, | л’уб’и |, | б’иб’и |, | двугорбый |, | падоб’ийе |. Определим окружения элементов | и | и | ы |. Для удобства рассмотрения выпишем все непосредственные окружения в таблицу №1.

табл. №1

Элементы Окружения
б’- л б-# б - л б - т б’- т’ # - б л’- б’ б’- б’ б - й б’- й
И + + + + + +
Ы + + + +

Сочетаемость элемента с окружением отмечается знаком + на пересечении строки и столбца. Как видно, число окружений велико. При расширении исходного списка высказываний это количество будет возрастать. Поэтому имеет смысл выявить характерные черты окружений и представить их в более компактном виде.

Просматривая окружения, легко заметить общие признаки их компонентов: наличие мягкости или ее отсутствие. По этим признакам все элементы в окружениях сгруппируем следующим образом: сгруппируем в один ряд мягкие, введя символ класса мягких С’, и все «немягкие» объединим во второй разряд С. С’ = {б’, т’, л’, й}, С = {б, т, л}. Тогда таблицу № 1 можно преобразовать в таблицу № 2.

табл. №2

C’ - C C - # C - C C’ – C’ # - C C – C’
И + + +
Ы + + +

Отождествление некоторых окружений по признакам мягкости\твердости привело к сокращению их числа с 10 до 6.

Продолжим наш анализ окружений. Обращаем внимание на то, что не все члены окружений одинаково существенны для выбора элементов | и | и | ы |. Так, последующие элементы не диагностируют выбор, ср. | и | появляется перед –с и –с’, также и | ы |. Напротив, предшествующие элементы определяют правила выбора гласных. Учитывая это, можно представить окружения только в составе диагностических признаков, исключив постпозитивные члены. Это показано в таблице № 3.

табл. № 3

- C’- - C - # -
И + +
Ы +

Таким образом, упорядочения списка окружений приводит их к компактному виду. Теперь можно перейти к анализу дистрибуций элементов.

Таблица № 3 показывает, что дистрибуции | и | и | ы | дополнительны друг относительно друга: | и | встречается в таких окружениях, где не появляется | ы |, и наоборот. Отсюда следует, что | и | и | ы | находятся в отношении дополнительной дистрибуции. О таких элементах говорят, что их дистрибуции не пересекаются (в дистрибутивной таблице нет таких столбцов, в которых обе строки были бы заполнены знаком +). В общем виде дистрибутивная таблица имеет вид:

X - Y -
a +
b +

Элементы a и b не встречаются в одинаковых окружениях (X или Y), их окружения не пересекаются. По критерию дополнительной дистрибуции элементы объединяются в единый класс, который считается элементом следующего шага описания. Для обозначения классов фонемных элементов используем прописные буквы: И = {| и |, | ы |}.

Полученные классы элементов дескриптивисты называют фонемами, а члены класса – аллофонами, или позиционными вариантами фонемы. Для фонемы устанавливается полная дистрибуция как сумма дистрибуций аллофонов. Так, дистрибуция И включает окружения C’-, C -, # -.

ДОПОЛНИТЕЛЬНЫЕ КРИТЕРИИ ДЛЯ ОБЪЕДИНЕНИЯ ЭЛЕМЕНТОВ В ФОНЕМЫ.

Критерий дополнительной дистрибуции дает лингвисту строго формальные основания для группировки элементов. Такой тип отношений между элементами в терминах теории множеств интерпретируется как отношение множества к его дополнению. Однако этот формальный метод обеспечивает получение единственной классификации элементов только при условии, если число их не более двух. В практическом анализе приходится иметь дело с большим количеством элементов. В этом случае можно по-разному группировать элементы. Допустим, что дистрибутивная таблица имеет вид:

X - Y - Z - U -
a + +
b +
c +
d +

Тогда по критерию дополнительной дистрибуции можно построить следующие объединения элементов по два: {a, b}, {a, c}, {a, d}, {b, c}, {c, d}. Можно сгруппировать элементы и одним из следующих способов: {a, b, c}, {d} или {a, c, d} {b}. Таким образом, формальные правила разрешают несколько классификаций элементов.

Для уменьшения неоднозначностей в выделении фонем предлагаются некоторые другие критерии, которые лингвист может использовать по своему усмотрению.

1) Запрещается относить к одной фонеме элементы, которые входят в минимально различающиеся пары высказываний. Например, если будет обнаружено, что помимо учтенных высказываний, | и | и | ы | встречаются еще в такой паре названий букв, как «и», «ы», то это может рассматриваться в пользу необъединения их в один класс. Ср. другой пример из английского языка: при любой дистрибуции не следует объединять | k | и | t |, поскольку они образуют минимальные пары cry - «кричать, плакать» и try - «пытаться, стараться».

Иными словами, отношение дополнительной дистрибуции несовместимо с отношением контрастной дистрибуции у одной и той же пары элементов.

2) Критерий фонетического подобия в ряде случаев подсказывает пути группировки элементов. Покажем это на двух примерах. Пусть имеется дистрибутивная таблица для четырех элементов | и |, | ы |, | е |, | э |, которые встречаются в одинаковых окружениях.

C’ - C - # -
И + +
Ы +
Е +
Э + +

Такое распределение допускает двоякое объединение: | ы | может быть включен в класс {и, ы} или {ы, е}. Дополнительный учет степени фонетического сходства фонемных элементов поможет выбрать одну из группировок ( | ы | и | и | имеют общий фонетический признак – степень закрытости). Мы получаем фонемы {и, ы} и {е, э}.

3) Важным критерием при классификации является симметрия окружений. Удобно строить фонемы так, чтобы они имели большую свободу сочетаемости с другими элементами. Для дальнейшего анализа не желательно получать фонемы с ограниченными окружениями, специфичными для одной фонемы, ибо это затрудняет сопоставление фонем друг с другом.

Исходными данными для определения отношения симметрии служит список фонем обследуемого языка {a,b,c,d…} (исходное множество Р). Далее вводится абстрактная система возможностей двух фонемных сочетаний, которая заключается в том, что любая фонема может предшествовать или следовать за любой другой, включая саму себя: aa, ab, ac…ba, bb, bc…

Строится квадрат множества Р x Р:

a b c d
a aa ab ac ad
b ba bb bc
c ca cb
d da

Такой квадрат является эталоном, с которым соотносят реальную дистрибуцию. Последняя же не покрывает абстрактных возможностей сочетания фонем и заключается в том, что только некоторые сочетания действительно встречаются.

Далее устанавливаются отношения каждой фонемы ко всему множеству фонем Р.

Предварительно устанавливаются следующие понятия:

αx – альфа-поле – подмножество фонем, принадлежащих исходному множеству Р и способных выступать в качестве первого члена в последовательностях из двух фонем, если х – второй член последовательности.

βх – бета-поле – подмножество фонем, принадлежащих исходному множеству Р и способных выступать в качестве второго члена в последовательностях из двух фонем, если х – первый член последовательности.

τх – тау-поле, которое является суммой αx и βх (τх = αx U βх)

Так же определяется и пересечение αx и βх (τх = αx ∩ βх)

После этого приступают к выявлению отношений симметрии. Фонема х считается симметричной фонеме y, если встречается как последовательность xy, так и yx.


Общие итоги дистрибутивного анализа на фонетическом уровне.

Процедуры отождествления фонемных элементов по критерию дополнительной дистрибуции открывают различные возможности выделения фонем. Полученная классификация может подвергаться дальнейшему анализу и уточнению. Так, можно найти пути для устранения ограничений в дистрибуции фонем за счет учета стыков, т.е. границ между цепочками фонем, отмеченных паузами. Учитывая специфику сочетаемости фонем в началах и концах высказываний, удается сделать классификацию более обобщенной.

Повторная фонемизация также может иметь место в тех случаях, когда оказывается удобным представить какой-либо элемент с резко ограниченной дистрибуцией в виде двух сегментов с большей свободой сочетаемости (например, | č | в виде | tš |).

Конечная цель дистрибутивного анализа на уровне фонем состоит в том, чтобы определить фонемную структуру языка, т.е. дать описание фонемного состава актов речи. Для этого проводится учет комбинаций фонем в речи и их типизация. Так, если | p |, |b |, | t |, | d |, | k |, | g| встречаются перед | a |, | i |, | u |, то вводится символ класса фонем С для каждого из шести согласных и V для каждой из трех гласных, и говорят, что встречаются СV. Это утверждение равносильно утверждению, что встречаются | pa |, | pi |, | pu |, | ba | и т.д. Выделяют классы фонем (типа согласных и гласных), выводятся формулы сочетаемости их в высказываниях. Так, для языка йокут установлена следующая структура высказывания: # [CV(C:)] CV(C)#, где # – знак стыка высказываний и границ контура, C - согласный, V - гласный, : - долгота фонемы; в круглые скобки заключены компоненты, которые иногда встречаются, иногда не встречаются, в квадратные скобки – компоненты, которые встречаются редко. Подставляя вместо символов определенные фонемы, можно построить любое высказывание языка.