Оценка достоверности результатов качественно-количественного исследования опирается на целый ряд критериев. Основной — соответствие между качественным анализом и количественными
284
данными, внутренняя логика цифр. Если исследуется конечная совокупность или бесконечная однородная совокупность, то появляется возможность оценить степень достоверности вероятностно-статистическими методами. В простейшем виде вероятностно-статистическая методика в применении к языкознанию выглядит следующим образом: 2 xi
Х---п — средняя частота явления
G ~ п: среднее квадратическое отклонение, т. е. степень размахаtS
колебаний выборочных частот около их средней частоты, Z= ~/=? относительная ошибка (не ошибка исследователя, а степень достоверности. Результаты считаются достоверными, если она не превышает 30 %.). В формуле t — особый коэффициент, зависящий от
объема выборки, N — количество выборок Z(jo-*)2.
Х2 = х — определение существенных расхождений, т. е. принадлежности данных фактов к одной группе закономерностей. Для этой же цели используется критерий Стьюдента. Результаты сравниваются с табличными.
При изучении стилей возможно применение двух типов статистики: вероятностной и симптоматической. Симптоматика успешно может быть применена при статистическом описании функциональных стилей, поскольку она выявляет процентные соотношения между различными типами языковых явлений.
Вероятностная статистика помогает установить степень достоверности полученных результатов, величину и количество выборок для анализа с заданной точностью; при наличии существенных расхождений между стилями возможно определение расстояния между ними; корреляционный анализ может выявить степень взаимозависимости анализируемых элементов. Методы вероятностной статистики помогают избрать объективные критерии для диффе-
285
Методика статистического исследования применима не только для изучения языковых стилей, но с успехом может использоваться при исследовании речевых стилей. Б. Н. Головин, много сделавший в этой области, отмечает: "Авторские речевые стили, несомненно, во многом (если не во всем) определяются устойчивыми для каждого автора соотношениями частот разных элементов языка". Изучение речевых стилей позволяет глубже изучить образную систему великих мастеров слова, а также наметить тенденции в формировании и развитии национального литературного языка. Авторские речевые стили являются отдельными по отношению к общему — функциональному стилю языка. При наличии большой выборки текстов различных авторов, работавших приблизительно в одно и то же время, индивидуальные различия отодвигаются на второй план, а на первый выступают особенности функционального стиля. Зная особенности речевых стилей отдельных художников слова, можно определить, как развивается литературный язык, кто оказывает наибольшее воздействие на его формирование и развитие.
Для изучения авторских речевых стилей большое значение имеет корреляционный анализ, который позволяет выявить степень взаимозависимости и взаимосвязи языковых элементов. В этом плане интересны исследования по определению авторства ряда анонимных произведений и целый ряд других.
Широкое использование вероятностно-статистических методов в изучении письменной подсистемы языка в отечественном языкознании началось сравнительно недавно, в конце 50-х — начале 60-х годов, поэтому аппарат статистического исследования еще далеко не совершенен, а громоздок. Значительную роль в разработке статистической методики сыграли работы, выполненные сотрудниками Института языковедения Украины под руководством В. И. Пе-ребейнос, исследования Б. Н. Головина и его последователей, а также целого ряда других ученых.
286
Автоматизация лингвистических работ
Для современной лингвистики характерно использование специальных технических средств и современной аппаратуры. Это вызвало технический аспект лингвистики, породило инженерное языковедение.
Применение специальной аппаратуры для изучения звуков и интонации того или иного языка получило название экспериментально-фонетического метода. Метод располагает рядом приемов, различающихся аппаратурой, условиями постановки эксперимента или получения результата. Экспериментально-фонетические приемы делятся на соматические, пневматические, электроакустические (или электрографические).
Соматические приемы основаны на том, что путем изучения телесных (соматических) выражений физиологических процессов говорения делается заключение о фонетическом явлении. Основные приемы: палатография, фотографирование органов артикуляции, рентгеносъемка речевого аппарата и пневматическое измерение речевого дыхания.
Пневматические приемы состоят в записи при помощи Мацеев-ских барабанчиков на закопченной бумаге кимографа кривых, которые регистрируют произносительные движения органов речи и изменения основного тона и шумов, возникающих в результате движения воздушного столба в ротовой, носовой и гортанной полости.
Электроакустические приемы основаны на преобразовании звуковых особенностей речи в электрические колебания. Для этого используется в основном осциллограф и спектрограф.
При использовании соматических приемов звуки речи изучаются по схемам, изображающим работу органов речи. При пневматических и электроакустических приемах изучается запись звука в форме кривых. Экспериментально-фонетические приемы дают надежную и точную акустическую и артикуляционную характеристику звуков речи, формантную структуру, т. е. спектр звука.
Появление ЭВМ внесло значительные изменения в практику научных исследований, поставило перед наукой новые задачи и проблемы. В языкознании такими проблемами стали автоматический перевод, машинное составление и сокращение (реферирование) текста.
Машинный перевод (МП) является комплексной научной проблемой, требующей решения ряда лингвистических, логико-математических и инженерных задач. Основная трудность состоит в том,
287
Машинный перевод — выполняемое на ЭВМ действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. В современных системах МП участвует человек (редактор). Для осуществления МП в ЭВМ вводится программа (алгоритм), словари входного и выходного языков, содержащие разнообразную информацию. Наиболее распространенная последовательность формальных операций, составляющих анализ синтез в системе МП: ввод текста и поиск входных словоформ в словаре с сопутствующим морфологическим анализом; перевод идиом; определение основных грамматических (морфологических, синтаксических, а также семантических, лексических) признаков, необходимых для перевода в рамках данной пары языков, по входному тексту; разбор омогра-фии; лексический анализ и перевод (в том числе многозначных слов с учетом контекста); окончательный грамматический анализ с целью доопределения информации, необходимой для синтеза; синтез выходных словоформ, предложений и текста в целом. Анализ может производиться как пофазно, так и для всего текста, с определением в последнем случае анафорических связей.
Первые опыты МП были осуществлены в США в конце 40-х годов XX века с появлением ЭВМ. В нашей стране первый эксперимент по МП бьш выполнен И. К. Вельской (лингвистическая основа алгоритмов) и Д. Ю. Пановым (программа реализации) в Институте точной механики и вычислительной техники АН СССР (1954 год). Работы по МП ведутся во многих странах мира.