Смекни!
smekni.com

Курс лекций по теории вероятностей (стр. 16 из 20)

Нужно как-то нормировать ковариацию, получив из нее «безразмерную» величину, абсолютное значение которой

а) не менялось бы при умножении или сдвиге случайных величин на число;

б) свидетельствовало бы о «силе зависимости» с. в.

Говря о «силе» зависимости между с.в., мы имеем в виду следующее. Самая сильная зависимость – функциональная, а из функциональных – линейная зависимость, когда ξ= аη + b п.н. Бывают гораздо более слабые зависимости. Так, если по последовательности независимых случайных величин ξ1ξ2 построитьξ= ξ1 +…ξ24 + ξ25 η = ξ25 +ξ26 + …+ξ90 , то эти величины зависимы, но очень “слабо зависимы”: через одно-единственное общее слагаемое ξ25 .

Итак, следующая величина есть всего лишь ковариация, нормированная нужным образом.

12.2 Коэффициент корреляции

Определение 43. Коэффициентом корреляции ρ(ξ, η) случайных величин ξ, η, дисперсии которых существуют и отличны от нуля, называется число

Пример 42. Рассмотрим продолжение примера 41, но пусть ξи η будут не только независимыми, но и одинаково распределенными случайными величинами, и их дисперсия отлична от нуля. Найдем коэффициент корреляции величин ξи ξ + η. Согласно формуле (10),

Поэтому

Определение 44. Случайные величины ξи η называют некоррелированными, если cov(ξ, η) = 0 (или если ρ(ξ, η) = 0, — в том случае, когда коэффициент корреляции существует).

Замечание 17. Если одна из величин ξи η — постоянная, то эти величины независимы, и cov (ξ, η) = 0. Естественно в этом случае тоже полагать, что ξи η «некоррелированы», хотя коэффициент корреляции не определен (дисперсия постоянной равна 0).

12.3 Свойства коэффициента корреляции

Всюду далее специально не оговаривается, но предполагается, что коэффициент корреляции существует.

Теорема 26.

Коэффициент корреляции обладает следующими свойствами.

1. Если с. в. ξи η независимы, то ρ(ξ, η) = cov(ξ, η) = 0.

2. ½ρ(ξ, η)½£. 1

3. ½ρ(ξ, η)½=1, если и только если с. в. ξи η с вероятностью 1 линейно связаны, т.е. существуют числа а ¹ 0 и b такие, что P(η = + b) = 1.

Определение 45. Пусть Dконечна и отлична от нуля. Определим случайную величину

Преобразование

называется стандартизацией случайной величины ξ, а сама с. в.
называется стандартизованной , или (слэнг!) центрированной и нормированной версией с. в. ξ.

Свойство 13. Стандартизованная с. в.

имеет нулевое математическое ожидание и единичную дисперсию.

Доказательство. Воспользуемся свойствами математического ожидания и дисперсии:

Полезно знать следующие часто употребляемые термины.

Определение 46. Говорят, что величины ξи ηотрицательно коррелированы, если ρ(ξ, η) < 0; говорят, что величины ξи ηположительно коррелированы, если ρ(ξ, η) > 0.

Смысл знака коэффициента корреляции особенно ясен в случае ½ρ(ξ, η) ½= 1. Тогда знак ρ равен знаку a в равенстве η = aξ+ b п.н. То есть ρ(ξ, η) = 1 означает, что чем больше ξ, тем больше и η. Напротив, ρ(ξ, η) = -1 означает, что чем больше ξ, тем меньше η. Похожим образом можно трактовать знак коэффициента корреляции и в случае, когда ½ρ(ξ, η) ½< 1, помня при этом, что зависимость величин ξи η теперь уже не линейная и, возможно, даже не функциональная.

Так, величины ξи ξ + η в примерах 41 и 42 положительно коррелированы, но их зависимость не функциональная.

Пример 43.

Если с. в. ξи η есть координаты точки, брошенной наудачу в треугольник с вершинами (2,0), (0,0) и (0,1), то коэффициент корреляции ρ(ξ, η) отрицателен. Это можно объяснить «на пальцах» так: Чем большеξ, тем меньше уηвозможностей быть большой) Предлагаю убедиться в этом, проверив справедливость следующих высказываний.

Во-первых,

Во-вторых,

Совместное распределение координат точки, брошенной наудачу в произвольную (измеримую) область D на плоскости имеет постоянную плотность во всех точках области D. Это связано с понятием «наудачу»: вероятность попасть в любую область AÌD, с одной стороны зависит только от площади А и не зависит от формы и положения А внутриD, равняясь с другой стороны, интегралу по области А от плотности совместного распределения координат точки. Эти два качества возможно совместить, только если плотность совместного распределения постоянна внутри D. Более того, эта постоянная, как легко видеть, есть просто

(хотя бы потому, что интеграл от нее по всей области D должен ровняться вероятности попасть в D, или единице).

Распределение точки, брошенной наудачу в область (все равно где), называют равномерным распределением.

Итак, плотность равномерного распределения в произвольной области на плоскости — постоянная, равная (1/ площадь области) для точек внутри области и нулю — вне. Поэтому (а также потому, что площадь этого треугольника равна 1)

То есть ковариация (а с ней и коэффициент корреляции) отрицательна (посчитать cov(ξ, η)).

Пример 44.

Найти коэффициент корреляции между числом выпадений единицы и числом выпадений шестерки при n подбрасываниях симметричного кубика.

Решение. Обозначим для i = 1, 2, 3, 4, 5, 6 через ξi случайную величину, равную числу выпадений грани с i очками при n подбрасываниях кубика. Посчитаем cov1, ξ6).

Каждая из случайных величин ξi имеет биномиальное распределение с параметрами n и 1/6, поэтому

.

Заметим, что сумма ξ1 + … + ξn этих величин равна n. В силу симметрии кубика, все математические ожидания

одинаковы, но, скорее всего, отличаются от

Посчитаем

С одной стороны, это равно

с другой стороны,

Отсюда

Следовательно, искомый коэффициент корреляции равен

Интересно, что полученный коэффициент корреляции не зависит от n.

... Откуда, наконец, вытекает то удивительное, по-видимому, следствие, что, если бы наблюдения над всеми событиями продолжать всю вечность, причем вероятность, наконец, перешла бы в полную достоверность, то было бы замечено, что в мире все управляется точными отношениями и постоянным законом изменений, так что даже в вещах, в высшей степени случайных, мы принуждены были бы признать как бы некоторую необходимость и, скажу я, рок.

Я к о б Б е р н у л л и, Ars conjectandi (1713)

Раздел 13. Куда и как сходятся последовательности случайных величин

13.1 Сходимость «почти наверное» и «по вероятности»

Напомню, что случайная величина есть (измеримая) функция из некоторого абстрактного множества Ω в множество действительных чисел. Последовательность случайных величин есть, тем самым, последовательность функций (определенных на одном и том же пространстве элементарных исходов Ω). И если мы хотим говорить о сходимости последовательности случайных величин n }¥n=1 , не будем забывать, что мы имеем дело не с последовательностью чисел, а с последовательностью функций. Существуют разные виды сходимости последовательности функций. Всякий раз давать определение какой-либо сходимости мы будем, опираясь на сходимость числовых последовательностей, как на уже известное основное понятие.

В частности, при каждом новом ω ÎΩ мы имеем новую числовую последовательность n (ω )}¥n=1 . Поэтому, во-первых, можно говорить о знакомой из математического анализа (почти) поточечной сходимости последовательностей функций: о сходимости «почти всюду», которую в теории вероятностей называют сходимостью «почти наверное».