В уравнении парной линейной регрессии:
b – коэффициент парной линейной регрессии, он измеряет силу связи, т.е. характеризует среднее по совокупности отклонение у от его средней величины на принятую единицу измерения.
b=20 при изменении х на 1 признак у отклониться от своего среднего значения на 20 в среднем по совокупности.
Положительный знак при коэффициенте регрессии говорит о прямой связи между признаками, знак «-» говорит об обратной связи между признаками.
§4. Применение парного линейного уравнения регрессии.
Основное применение – прогнозирование по уравнению регрессии. Ограничением при прогнозировании служат условия стабильности других факторов и условий процесса. Если резко измениться в нем среда протекающего процесса, то данное уравнение регрессии не будет иметь места.
Точечный прогноз получается подстановкой в уравнение регрессии ожидаемого значения фактора. Вероятность точной реализации такого прогноза крайне мала.
Если точечный прогноз сопровождается значением средней ошибки прогноза, то такой прогноз называется интервальным.
Средняя ошибка прогноза образуется из двух видов ошибок:
1. ошибок 1 рода – ошибка линии регрессии
2. ошибка 2 рода – ошибка связанная с ошибкой вариации.
Средняя ошибка прогноза.
- ошибка положения линии регрессии в генеральной совокупностиn - объем выборки
xk – ошибочное значение фактора
- СКО результативного признака от линии регрессии в генеральной совокупностиКорреляционный анализ предполагает оценку тесноты связи. Показатели:
при
=-1 связь функциональная обратная, =1 связь функциональная прямая, при =0 связь отсутствует.МИНУСЫ
Применяется только для линейных связей, используется для оценки связей между количественными признаками. Рассчитываются только по индивидуальным значениям.
Корреляционное отношение:
Эмпирическое:
оба вида дисперсии рассчитываются по результативному признаку.Теоретическое:
- дисперсия значений результативного признака рассчитанных по уравнению регрессии - дисперсия эмпирического значения результативного признакаПЛЮСЫ
· высокая степень точности
· подходит для оценки тесноты связи между описательным и количественным признаком, но количественный должен быть результативным
· подходит для любых типов связей
Коэффициент корреляции Спирмена
xi | yi |
10 | 1 |
20 | 7 |
30 | 4 |
Ранги – порядковые номера единиц совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же порядке от меньших к большим или наоборот. Если ранги единиц совокупности обозначить рх и ру, то коэффициент корреляции рангов примет следующий вид:
Преимущества коэффициента корреляционного ряда:
Недостатки коэффициента Спирмена.
1. одинаковым разностям рангов могут соответствовать совершенно отличные разности значения признака (в случае количественных признаков). Пример: Выработка электроэнергии страны в год
США 2400 кВт/ч 1
РФ 800 кВт/ч 2
Канада 600 кВт/ч 3
Если среди значения Спирмена встречаются несколько одинаковых, то образуются связанные ранги т.е. одинаковые средние номера
800 1
600 2,5
600 2,5
400 4
В данном случае коэффициент Спирмена рассчитывается следующим образом:
j – номера связок по порядку для признака х
Aj – число одинаковых рангов в j связи по х
k – номера связок по порядку признака у
Bk – число одинаковых рангов в к-ой связке по у
4. Коэффициент корреляции ранга Кендалла
- максимальная сумма рангаS – фактическая сумма рангов
Дает более строгую оценку чем коэффициент Спирмена.
Для расчета
все единицы ранжируются по признаку х по признаку у для каждого ранга подсчитывается число последующих рангов превышающих данный их сумму обозначим Р и число последующих рангов ниже данного обозначения Q.S=P-Q
P+Q=1/2n(n-1)
5. Коэффициент корреляции ранга Фехнера.
х | у | ||||
600 | 50 | + | + - C | ||
700 | 40 | + | 0 – C | ||
300 | 20 | - | - - C | ||
400 | 50 | - | + - H |
Коэффициент Фехнера – мера тесноты связи в виде отношения разности числа пар совпадающих и не совпадающих знаков к сумме этих чисел.
1. расчет средних по х и у
2. сравниваются индивидуальные значения xi yi со средними значениями с обязательным указанием знака «+» или «-». Если знаки совпадают по х и у, то мы относим их числу «С» если, нет, то к «Н».
3. подсчитываем количество совпадающих и несовпадающих пар.
Коэффициент Фехнера очень грубый коэффициент оценки связи, не учитывающий величину отклонений от среднего значения, но он может служить ориентиром для оценки интенсивности связи. Часто а | Редко в | |
Есть А | Аа 5 | Ав 10 |
Нет В | Ва 7 | Вв 4 |
Задача измерения связи становится перед статисткой по отношению к описательным признакам, важным частным случаем такой задачи, измерения связи между 2 альтернативными признаками один из которых причина другой последствие.
Теснота связи между 2 альтернативными признаками может быть измерена с помощью 2х коэффициентов:
1. коэффициент ассоциации
2. коэффициент контингенции
Коэффициент контингенции имеет недостаток: при равных нулю одного из двух гетерогенных сочетаний Ав или Ва коэффициент обращается в единицу. Очень либерально оценивает тесноту связи – завышает ее.
Коэффициент Пирсона
При наличии не двух, а более возможных значений каждого из взаимосвязанных признаков рассчитываются следующие коэффициенты:
Коэффициент Пирсона рассчитывается по квадратным матрицам
доход | Ниже нормы | Норма | 2 нормы | 3 нормы |
1-3 ПМ | 2 | 4 | - | - |
3-7 ПМ | 5 | 3 | 5 | - |
7-12 ПМ | 10 | 7 | 6 | 1 |
Св. 12 ПМ |
к1 и к2 – число группы по признакам 1 и 2 соответственно. Минус коэффициента Пирсона в том, он не достигает 1 даже при увеличении количества групп.
Коэффициент Чупрова (1874 –1926)