Смекни!
smekni.com

Статистика как наука 2 (стр. 6 из 8)

17

400-600

модальный интервал

медианный интервал

12+17=29

15,5

600-800

29+15,5=44,5

Итого: 44,5


По кумулятивной кривой можно определить медиану.

Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы.

Место медианы ( Nме) =(n+1)/2

К примеру, (44,5+1)/2=22,75

Превышающие значение накопленной частоты = 29>22.75, поэтому медианный интервал –

[400-600].

Ме = Хме + i * (((n+1)/2)-S(-1))/fme

Me=400+200*((22,75-12)/17)=526,47

25. Показатели центра распределения вариационного ряда (средняя, мода, медиана).

1.Средняя арифметическая – значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности.

Для дискретного ряда

Х (сред.)=∑хifi/fi

Для интервального ряда –

Х (сред.)=∑х´ifi/fi

2. Мода – наиболее часто встречающееся значение признака у единиц данной совокупности.

Модальным считается интервал, которому соответствует максимальное значение частоты.

Хмо – это нижняя граница модального интервала

Fmo – частота модального интервала

fmo-1 – частота интервала, предшествующая модальному

fmo+1 – частота интервала следующего за модальным

Мо = Хмо + i * (fmo – (fmo-1))/(fmo-1)+(fmo+1)

3. Медиана.

Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы.

Место медианы ( Nме) =(n+1)/2

Хме – нижняя граница медианного интервала

N – количество единиц в совокупности

S(-1) – накопленная частота интервала, предшествующая медианному

Fme – частота медианного интервала

Ме = Хме + i * (((n+1)/2)-S(-1))/fme

26. Соотношение средней, моды и медианы в вариационном ряду.

27. Показатели степени вариации (размах, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия).

1.Размах колебаний, или размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности.

R=Xmax-Xmin

2. Среднее квадратическое отклонение – это обобщающая характеристика абсолютных размеров вариаций признака в совокупности.

∂=√∂2

3. Дисперсия – это средняя арифметическая квадратов отклонений индивидуального значения признака от общей средней.

2=∑((хi-x(сред.))2)/ni

4. Среднее линейное отклонение вычисляется по формуле:
d(сред.) = ∑|хi-х(сред.)| / n – для несгруппированных данных

d(сред.) = ∑|хi-х(сред.)| * fi / fi – для сгруппированных данных

28. Показатель однородности совокупности – коэффициент вариации.

V=∂/x*100% - показатель относительной колеблемости.

Всегда выражается в %.

Если V < 33%, то совокупность считается однородной.

29. Виды дисперсий: внутригрупповая, межгрупповая и общая. Правило сложения дисперсий.

Общая дисперсия – ее величина характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности.

Межгрупповая дисперсия – отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора положенного в основу группировки.

2 = ∑((Хi(сред.)-Хо(сред.))*ni)/ni,

где Хi – среднее по отдельной группе, а Хо – для всей совокупности.

Средняя внутригрупповая дисперсия – характеризует случайную вариацию, возникающую под влиянием неучтенных факторов, и не зависит от признака фактора, положенного в основу группировки.

2 (сред.) = ∑(i2*ni)/ ni,

где i2 – дисперсия по отдельной группе, i2=∑(Х-Хi)2*F/F

Перечисленные виды дисперсий взаимосвязаны между собой следующим равенством:

2=2+2(сред.)

Это равенство – правило сложения дисперсий:

Величина общей дисперсии равна сумме межгрупповой и средней внутригрупповой дисперсии.

30. Вариации альтернативного признака.

Альтернативный признак – это качественный признак, имеющий 2 взаимоисключающие разновидности.

АП принимает всего 2 значения:

  • Единица – это наличие признака
  • Ноль – это отсутствие признака

p+q=1,

где p – это доля обладающих признаком

q – не обладающих признаком.

Среднее значение альтернативного признака рассчитывается по формуле:

Х(сред.) = ((1* p)+(0* q))/ (p+q)= p

Дисперсия альтернативного признака рассчитывается по формуле:

2=((1-p)2*p+(0-p)2*q)/ p+q= p*q

Предельное значение вариации альтернативного признака = 0,25, оно получается, когда p=q=0,5.

31. Показатели формы распределения (показатель асимметрии, эксцесса).

Существует еще одна характеристика распределения данных, полученных по непрерывным шкалам, которую исследователь тоже должен обязательно учитывать. Это форма распределения.

Данные распределения старшеклассников по возрасту являются примером нормального распределения. Нормальным является такое распределение, при котором кривая построенного по его данным графика представляет собой колоколообразную симметричную кривую.

Например, если мы построим график по данным распределения старшеклассников по возрасту, то получим соответствующую колоколообразную кривую. Если же мы построим график по массиву третьеклассников и учителей, опрошенных в одной школе, мы получим две кривые. Нормальное распределение — это теоретическая кривая. Практически любые эмпирические данные в той или иной степени отклоняются от нормального распределения вероятностей, закону которого подчиняются распределения случайных величин. Но поскольку все расчеты, включающие значение среднего арифметического и стандартного отклонения, основаны на теории вероятности, в аналитическую задачу исследователя входит оценка (по крайней мере, приблизительная) того, насколько правомерно использовать данный тип анализа к полученным результатам. Поэтому даже на уровне описания (не говоря уже о множественном анализе), прежде чем приводить данные по их средним значениям (среднее арифметическое и стандартное отклонение), необходимо оценить характер формы распределения — в какой степени она приближается к нормальному распределению.

Для этого используют показатели скоса (асимметрии, skewness) и эксцесса (kurtosis). В скобках указываются термины, которые обычно у разных авторов используются для обозначения одних и тех же понятий. В частности, здесь приведены англоязычные обозначения рассматриваемых характеристик, которые приводятся в компьютерной программе обработки и анализа социологических данных — SPSS.

Показатель скоса (skewness) позволяет оценить степень и направленность асимметрии кривой распределения. В случае идеального нормального распределения асимметрия равна нулю.

В эмпирической социологии идеальные нормальные распределения практически не встречаются. Но существуют методы оценки степени приближения полученного распределения к нормальному. Коэффициент скоса имеет числовое значение и знак, указывающий направленность скоса. Чем больше величина отличается от нуля, тем большая асимметрия у полученного распределения, и, соответственно, большая погрешность может проявиться при применении коэффициентов статистического анализа, формула которых включает значения стандартного отклонения.

Существуют специальные процедуры оценки степени допустимости такой погрешности, а также искусственной нормализации шкалы. Исследователь может, при необходимости, осуществлять преобразование данных. С различными способами преобразования данных можно ознакомиться в специальной справочной и учебной литературе; но исследователю необходимо обязательно оценить степень асимметрии. (Простейшим косвенным показателем, указывающим на асимметрию, является расхождение между значениями среднего арифметического, моды и медианы; при идеальном нормальном распределении все три показателя равны).