Смекни!
smekni.com

История статистики (стр. 7 из 9)

Методы аналитических группировок и графический изложены в соответствующих темах.

Удобная форма изложения данных - корреляционная таблица (табл. 9.1).

Таблица 9.1

Корреляционная таблица

Часовая выработка ткани, м Количество станков, обслуживаемых одной работницей, шт.
5-7 7-9 9-11 11-13 13-15 15-17 17-19 Итого
10 - 15 7 4 2 1 14
15 - 20 3 8 5 4 20
20 - 25 2 11 8 2 23
25 - 30 5 13 7 1 26
30 - 35 1 16 3 20
35 - 40 2 6 19 3 30
40 - 45 3 7 18 28
Итого: 10 14 21 30 33 32 21 161

Таблица показывает, что частоты концентрируются у диагонали, идущей из левого верхнего угла в правый нижний. Это указывает на то, что связь между количеством обслуживаемых работницей станков и ее часовой выработкой ткани прямая (с увеличением числа обслуживаемых станков увеличивается выработка) или близкая к прямой (концентрация частот идет почти по прямой линии).

По данным таблицы можно рассчитать среднюю выработку по каждой из семи групп работниц, выделенных по числу обслуживаемых станков. Обозначив эти средние значения через

и произведя расчеты, получаем:
= 14,0;
= 16,79;
= 22,51;
= 24,67;
= 32,65;
= 36,88;
= 41,79.

Данные таблицы и результаты расчетов можно изобразить графически с помощью поля корреляции. Ломаная линия на графике (линия значений

) называется эмпирической линией регрессии.

Показатели тесноты связи. Для оценки тесноты связи применяется ряд показателей, одни из которых называются эмпирическими или непараметрическими, другие (выводимые строго математически) - теоретическими.

Коэффициент знаков (коэффициент Фехнера) вычисляется на основании определения знаков отклонений вариантов двух взаимосвязанных признаков от их средних величин.

Если число совпадений знаков обозначать через a, число несовпадений - через b, а сам коэффициент - через i , то можно записать формулу этого коэффициента так:

.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается не по значениям двух взаимосвязанных признаков, а по их рангам следующим образом:

ρx/y = 1 –

,

где di - разности рангов; n - число пар рангов.

Для определения тесноты связи между тремя и более признаками применяется ранговый коэффициент согласия - коэффициент конкордации, который вычисляется по формуле:

w =

,

где m - количество факторов;

n - число наблюдений;

S - сумма квадратов отклонений рангов.

Величина коэффициента конкордации более 0,5 показывает, что между исследуемыми величинами имеется тесная зависимость.

Если при определении тесноты связи с помощью приведенных ранговых коэффициентов имеются связные ранги, т.е. если двум или более показателям присвоен один и тот же ранг, то расчеты проводятся по формулам:

коэффициент Спирмена: ρx/y = 1 –

;

коэффициент конкордации: w =

,

где T =

(t3 – t), а t - количество связных рангов по отдельным показателям.

При исследовании социальных явлений и процессов большое значение имеет изучение качественных показателей и признаков, не имеющих количественной оценки:

a b a+b
c d c + d
a + c b + d a + b + c + d

Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой).

Коэффициенты вычисляются по формулам:

A =

- ассоциации;

K =

- контингенции.

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если A ³ 0,5, или K³ 0,3.

Если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона. Этот коэффициент вычисляется по формуле:

C =

,

где j2 - показатель взаимной сопряженности.

Расчет коэффициента взаимной сопряженности проводится по следующей схеме:

Группа признака A Группа признака В Итого
B1 B2 B3
A1 f1 f2 f3 n1
A2 f4 f5 f6 n2
A3 f7 f8 f9 n3
m1 m2 m3

Расчетj2 проводится так:

по первой строке

: n1 = L1;

по второй строке

: n2 = L2;

по третьей строке

: n3 = L3;

Следовательно, j2 = L1 + L2 + L3 – 1.

Интерпретация непараметрических коэффициентов связи в некоторых случаях, особенно когда они имеют отрицательное значение, затруднительна. Их абсолютные значения могут изменяться в пределах от 0 до 1. Чем ближе абсолютные значения к единице, тем теснее связь между исследуемыми признаками.

Корреляция и регрессия. Традиционные методы корреляционно-регрессионного анализа позволяют не только оценить тесноту связи, но и выразить эту связь аналитически. Применению корреляционно-регрессионного анализа должен предшествовать качественный, теоретический анализ исследуемого социально-экономического явления или процесса.

Связь между двумя факторами аналитически выражается уравнениями:

прямой

= a0 + a1x;

гиперболы

= a0 +
;

параболы

= a0 + a1x + a2x2 (или другой ее степени);

степенной функции

.

Параметр a0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов. Параметр a1 - коэффициент регрессии показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу. На основе этого параметра вычисляются коэффициенты эластичности, которые показывают изменение результативного признака в процентах в зависимости от изменения факторного признака на 1%:

Э = a1

.

Для определения параметров уравнений используется метод наименьших квадратов, на основании которого строится соответствующая система уравнений.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции:

r =

,

а при криволинейной зависимости с помощью корреляционного отношения:

h =

.

Расчет коэффициентов регрессии несколько осложняется, если ряды по исследуемым факторам сгруппированы, а связь криволинейная.

Если зависимость между двумя факторами выражается уравнением гиперболы

= a0 +
,

то система уравнений для определения параметров a0 и a1 такова:

na0 + a1

= ∑y;

a0

+ a1
= ∑y
.