σ
5. Коэффициент вариации: V = —— · 100 = 22.23
х
Таблица 4 – Расчет характеристик расселения статистического ряда
Группы по цене | Середина интервала, х 'i | Частоты, f i | Среднее линейное отклонение | Среднее квадратичное отклонение | ||
| x' i – x | | | x' i – x | · f i | (x'i – x)2 | (x'i – x)2 · f i | |||
1450-1769 1769-2088 2088-2407 2407-2726 2726-3045 3045-3364 3364-3683 3683-4000 | 1609.5 1928.5 2247.5 2566.5 2885.5 3204.5 3523.5 3840.5 | 8 9 28 17 22 3 8 5 | 963.5 644.5 325.5 6.5 312.5 631.5 950.5 1267.5 | 7708 5800.5 9114 110.5 6875 1894.5 7604 6337.5 | 928332.25 415380.25 105950.25 42.25 97656.25 398792.25 903450.25 1606556.2 | 7426658 37384222966607 718.25 2148437 1196376 7227602 8032781 |
x | x | Σ | x | 45444 | x | 3273760 |
6. Произвели расчет среднего квадратичного отклонения способом отчета от условного начала и упрощенным методом. Для этой цели составили таблицу 5.
Таблица 5 – Данные для расчета среднего квадратичного отклонения способом отчета от условного начала и упрощенным способом
Середина интервала, x' i | Частота, f i | Отсчет от условного начала | Упрощенный способ | ||||
xi – xo | x'i – xo i | x'i – xo 2i | x'i – xo i | (x'i)2 | (x'i)2 · f i | ||
1609.5 1928.5 2247.5 2566.5 2885.5 3204.5 3523.5 3840.5 | 8 9 28 17 22 3 8 5 | 0 319 638 957 1276 1595 1914 2231 | 0 1 2 3 4 5 6 7 | 0 1 4 9 16 25 36 49 | 0 9 112 153 352 75 288 245 | 2590490.2 3719112.2 5051256.2 6586922.2 8326110.2 10268820 12415052 14749440 | 20723921 33472009 14143517 11197767 18317442 30806460 99320420 73747201 |
x | 100 | x | x | x | 1234 | x | 694657288 |
Σ ——— · f i
i
σ2 = ————————— · i 2 – (x – xo)2 , σ = √ σ2 ,
Σ f i
Дисперсия и среднее квадратичное отклонение могут быть рассчитаны следующим образом:
Σ (x 'i) 2 · f iσ 2 = ————— – х 2
Σ f i
Размах вариации, как разность между максимальным и минимальным значением равно 2550т.р., показатель, учитывающий только 2 кратковременных случайных значений и признаков и не дает представление о вариациях по всей совокупности единиц. (х-х) – отклонение признаков х от типического уровня свободного от случайных колебаний, который является средней величиной х. При этом получают индивидуальное значение отклонения от средней х-х, которое следует рассчитать. Среднее линейное отклонение вычисляется как взвешенное по частоте отклонение по модулю середин интервалов от средней арифметической величины. Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Дисперсия-квадрат среднего квадратического отклонения. На дисперсии основаны практически все методы математической статистики. Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава.
2.4. Расчет моментов и форм распределения
1. Центральные моменты 3-го и 4-го порядков по формулам:
Σ (x'i – х)3 · f i Σ (x'i – x)4 · f i
M'3 = ———————=79476512; M'4 = ———————=288833935648
Σ f i Σ f i
Результаты вычислений оформить таблицей 6.
Таблица 6 – Расчет центральных моментов
x'i | fi | x'i – х | (x'i – x)3 | (x'i – x)3 · fi | (x'i – x)4 | (x'i – x)4 · fi |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1609.5 1928.5 2247.5 2566.5 2885.5 3204.5 3523.5 3840.5 | 8 9 28 17 22 3 8 5 | -963.5 -644.5 -325.5 -6.5 312.5 631.5 950.5 1267.5 | -894448122.8 -267712571.1 -34486806.3 -274.6 30517578.1 251837305.8 858729462.6 2036310046 | -7155584982.4 -2409413139.9 -965630576.4 -4668.2 671386718.2 755511917.4 6869835700.8 10181550234 | 861800766390 17254075209 11225455475 1784.9 9536743156.2 159035258660 816222354225 2581022984414 | 6894406131120.4 1552866768810.5 314312753301.7 30343.3 209808349437.5 477105775980.1 6529778833800.4 12905114922070 |
х | 100 | х | х | 7947651203.5 | х | 28883393564861 |
2. Нормированные моменты 3-го и 4-го порядков:
M '3 M '4
Z 3 = —— = 0.4 ; Z 4 = ——— =2.7 ; (σ=572.16)
σ3 σ4
3. Коэффициент крутости по формуле: Ε к = Z 4 – 3=2.7-3=-0.3
Центральные моменты – средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Величина третьего момента зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами либо наоборот. С помощью момента четвертого порядка характеризуется более сложное свойство рядов распределения. Правосторонняя скошенность(правая ветвь распределения длиннее, Z3>0). Плосковершинное распределение (Ек<0).
2.5. Определение показателей связи при парной линейной зависимости
Выписали из таблицы 1 данные о цене и площади квартир (не менее 100) в таблицу 7 (прил.Г).
1. Для определения направления и формы связи построили корреляционное поле (рисунок 3, прил.Д)
2. Вычислили ху, х2, у2 и их суммы.(прил.Г)
3. Система нормальных уравнений:
Σ у = n а + в Σ х ,Σ ху = а Σ х + в Σ х2
Значение параметра «в»:
Σ у Σ ху Σ х Σ х 2в = —— – ——— ׃ —— – ——
n Σ х n Σ х
В= -1431
4. Уравнение регрессии, выражающее связь между общей (жилой) площадью и ценой на квартиры: ух = а + в х=58000.2-1431*х
5. Величины для исчисления коэффициента корреляции:
Σ х
а) среднее значение факторного признака (площади): х = —— = 38.7 ;
n
Σ у
б) среднее значение результативного признака (цены): у = —— =2573.25
Σ ху n
в) среднее значение произведения: х у = ——— = 100224.1
n
Σ х 2
г) среднее квадратическое отклонение по площади: σ х = √ —— – (х)2
n
Σ у2
д) среднее квадратическое отклонение по цене: σу = √ —— – (у)2
n
6. Линейный коэффициент парной корреляции по формуле:
х · у – х · у
r = —————— = 0.7;
σх · σу
7. Коэффициент детерминации (в %) : d = r2 · 100 = 49%;
8. Проверяем коэффициенты корреляции и регрессии на существенность (при уровне значимости = 0,05):
n – 2 σх √ n – 2
tr = r · √ ——— = 9.7 ; tв = в · ————— = 9.7
1 – r2 σу √ 1 – r2
tтабл.=1.97
Нормальные уравнения для прямой линии регрессии являются системой двух уравнений с двумя неизвестными а и в. Все остальные величины, входящие в систему, определяются по исходной информации. Таким образом, однозначно вычисляются при решении этой системы уравнений оба параметра уравнения линейной регрессии. Коэффициент парной линейной регрессии(в) имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Показатели корреляционной связи являются лишь оценками той или иной статистической закономерности, поскольку в любом параметре сохраняется элемент не полностью погасившейся случайности, присущей индивидуальным значениям признаков. С вероятностью 0.95 (1-0.05) отвергаем гипотезу Но, а равенство коэффициента корреляции генеральной совокупности 0. Фактическое значение критерия Т Стьюдента превышает его критическое значение (9>2). Следовательно, величина коэффициента регрессии и корреляции статистически достоверно – цена квартиры зависит от ее общей площади.
2.6 Группировка по одному признаку и построение групповой таблицы.
По данной совокупности квартир выписали из приложения А в таблицу 8 в ранжированном порядке необходимые для группировки данные. Произвели логический и арифметический контроль исходной информации.
Выделили три группы квартир по цене, соблюдая два условия: достаточное количество квартир в каждой группе и однородность качественного состава каждой группы.