Смекни!
smekni.com

Применение методов математической статистики и теории вероятностей в задачах теоретической лингвистики при анализе устной и звучащей речи на русском и английском языках (стр. 2 из 4)

Теперь вместо абсолютных частот

укажу относительные частоты (частости)
в процентах:
X
f*100% 12,38% 9,52% 7,62% 12,38% 13,33% 17,14% 10,47% 7,62% 4,76%
X
f*100% 2,85% 0% 0,95% 0% 0% 0% 0% 0% 0,95%

Самые распространённые слова в данном стихотворении имеют длину в 6 фонем (17,14%)

Проведу аналогичные действия со стихотворением «Колыбельная»:

A Cradle Song

Sweet dreams form a shade,

O'er my lovely infants head.

Sweet dreams of pleasant streams,

By happy silent moony beams

Sweet sleep with soft down,

Weave thy brows an infant crown.

Sweet sleep Angel mild,

Hover o'er happy child.

Sweet smiles in the night,

Hover over my delight.

Sweet smiles Mothers smiles

All the livelong night beguiles.

Sweet moans, dovelike sighs,

Chase not slumber from thy eyes,

Sweet moans, sweeter smiles,

All the dovelike moans beguiles.

Sleep sleep happy child.

All creation slept and smil'd.

Sleep sleep, happy sleep, 1

While o'er thee thy mother weep

Sweet babe in thy face,

Holy image I can trace.

Вариационные ряды длин словоупотребления в фонемах:

4 5 4 1 5

4 3 5 7 3

4 5 4 7 6

3 4 7 4 4

4 4 4 4

3 3 5 2 6 5

4 4 6 5

6 2 3 4 5

4 6 2 2 4

6 4 3 6

4 6 5 6

2 2 7 4 7

4 5 7 4

4 3 6 4 2 3

4 5 4 6

2 2 7 5 7

4 4 4 4

2 7 5 3 6

4 4 4 4

4 4 2 2 4 3

4 4 2 2

4 3 4 2 3 5

Дискретный вариационный ряд длины словоформ в фонемах в данном стихотворении будет таков:

X 1 2 3 4 5 6 7
N 1 15 13 41 14 12 9

Где так же, как и в предыдущем примере, X – признак (количество фонем в слове), N – сумма всех вариант,

– варианты,
– число повторений вариант.

N = 105

Очевидным является то, что дискретные вариантные ряды двух стихотворений сильно отличаются друг от друга, это можно представить нагляднее, если вместо абсолютных частот

указать относительные частоты
в процентах:
X
f*100% 0,95% 14,28% 12,38% 39,04% 13,33% 11,42% 8,57%

Различие между длинами словоформ в рассматриваемых стихотворениях состоит в том, что у английского автора преобладают слова в четыре фонемы (39,04%), в то время как у Зинаиды Гиппиус – в шесть. Так же несложно заметить, что количество вариантов в стихотворении «TheCradleSong» значительно меньше, чем в «Свободный стих».

2.2 Непрерывные вариационные ряды

Непрерывные вариационные ряды, как и дискретные, широко распространены в анализе устной и звучащей речи, так как здесь значения признака:

длина

частота

интенсивность звука

могут отличаться друг от друга на как угодно малую величину. Поскольку отличия между вариантами имеют непрерывный характер, используется только интервальное построение вариационного ряда. Для исследования данных фонетических аспектов нужны специальные измерительные приборы для замеров звучания слогов. Несмотря на невозможность проведения данного анализа, я расскажу о его основном принципе.

При наличии результатов эмпирических исследований, создаются непрерывные интервальные ряды, где

- длина слогов в мс, а интервалы вариант выглядят следующим образом – (
, (
), (
) и так далее.

Ширина интервала определяется по формуле Стерджесса:

.

При этом интервальная разность kокругляется до ближайшего целого числа, число интервалов lопределяется из выражения

.

2.3 Графическое построение дискретных лингвистических вариационных рядов для рассматриваемых стихотворений

Несмотря на его простоту, слабой стороной табличного описания колебания признака является недостаточная наглядность. Поэтому для достижения большей наглядности я использую графическое изображение интересующего меня распределения (длин словоформ по фонемам) – многоугольник распределения признака (полигон).


2.4 Ряды распределения дискретных случайных величин

Так как дискретная случайная величина может принимать возможные значения с различными вероятностями, чтобы охарактеризовать её в статистическом смысле, необходимо указать вероятности всех её значений.

Законом распределения вероятностей дискретной случайной величины называется таблица соответствия между возможными значениями этой величины и их вероятностями. Эта таблица – ряд распределения дискретной случайной величины.

Для первого стихотворения:

X 1 2 3 4 5 6 7 8 9
0.1238 0.0952 0.0762 0.1238 0.1333 0.1714 0.1047 0.0762 0.0476
X 10 11 12 13 14 15 16 17 18
0.0285 0 0.0095 0 0 0 0 0 0.0095

Для второго стихотворения:

X 1 2 3 4 5 6 7
0.095 0.1428 0.1238 0.3904 0.1333 0.1142 0.0857

По определению, сумма вероятностей событий в каждом из стихотворений должна быть равна 1

Сделаю проверку результатов. Для первого стихотворения:

0.1238 + 0.0952 + 0.0762 + 0.1238 + 0.1333 + 0.1714 + 0.1047 + 0.0762 + 0.0476 + 0.0285 + 0.0095 + 0.0095 = 0.9997
-

подсчёты произведены с небольшой погрешностью

Для второго стихотворения:

0.095 + 0.1428 + 0.1238 + 0.3904 + 0.1333 + 0.1142 + 0.0857 = 0.997
1

Из данных результатов следует, что предыдущие исследования сделаны без ошибок.

2.5 Математическое ожидание дискретной случайной величины

Математическим ожиданием дискретной случайной величины Х называется сумма произведений её всех возможных значений на соответствующие вероятности, обозначается через М(Х).

Если случайная величина принимает значения

, соответственно с вероятностями
,
, то