где 2 - дисперсия, x – варианта, f – частота вариант, (6)
по 1-й группе | Σ(Xi— 35,757)2 2 =—————————= 5,761 7 |
по 2-й группе | Σ(Xi— 40,389)2 2=—————————= 2,597 7 |
по 3-й группе | Σ(Xi— 46,80)2 2 =—————————= 7,383 6 |
по совокупности | Σ(Xi— 40,468)2 2=—————————= 5,140 20 |
3. Среднее квадратичное отклонение взвешенное:
, где – среднее квадратичное отклонение. (7)по 1-й группе | = =2,400 |
по 2-й группе | = = 1,612 |
по 3-й группе | = =2,717 |
по совокупности | = =2,267 |
4. Коэффициент вариации:
(8)по 1-й группе | 2,400 V= ———— ∙ 100 = 6,71%35,757 |
по 2-й группе | 1,612 V= ———— ∙ 100 = 3,99%40,389 |
по 3-й группе | 2,717 V= ———— ∙ 100 = 5,81%46,8 |
по совокупности | 2,267 V= ———— ∙ 100 = 5,60%40,452 |
Таблица 2.1
Таблица
расчёта основных показателей вариации среднегодового удоя молока от коровы
№ группы | № предприятия | Среднегодовой удой молока от коровы | Средняя арифметич | Отклонение от средней | Квадрат отклонений |
Х | Х | Х-Х | (Х-Х)2 | ||
1 | 1 | 36,4 | 35,757 | 0,643 | 0,413 |
2 | 32,6 | -3,157 | 9,967 | ||
3 | 33,1 | -2,657 | 7,06 | ||
4 | 34,0 | -1,757 | 3,087 | ||
5 | 38,1 | 2,343 | 5,490 | ||
6 | 36,9 | 1,325 | 1,756 | ||
7 | 39,3 | 3,543 | 12,553 | ||
Итого по первой группе | 0,283 | 40,326 | |||
2 | 8 | 41,4 | 40,389 | 1,011 | 1,022 |
9 | 38,2 | -2,189 | 4,791 | ||
10 | 40,2 | -0,189 | 0,036 | ||
11 | 39,6 | -0,789 | 0,623 | ||
12 | 43,7 | 3,311 | 10,963 | ||
13 | 39,9 | -0,489 | 0,239 | ||
14 | 41,1 | 0,711 | 0,505 | ||
Итого по второй группе | 1,377 | 18,179 | |||
3 | 15 | 49,3 | 46,80 | 2,5 | 6,25 |
16 | 49,1 | 2,3 | 5,29 | ||
17 | 43,6 | -3,2 | 10,24 | ||
18 | 44,2 | -2,6 | 6,76 | ||
19 | 49,8 | 3,0 | 9,0 | ||
20 | 44,2 | -2,6 | 6,76 | ||
Итого по третьей группе | -0,6 | 44,3 |
2.3. Выводы.
Для измерения социально-экономических явлений в статистике используется система абсолютных, средних и относительных показателей.
Средние величины показывают типические размеры признака в совокупности однородных единиц и определяются исходя из соотношения объема явления и численности единиц совокупности (ее объема). В зависимости от исходных данных используются различные виды средних - арифметические и гармонические простые и взвешенные.
Для оценки вариации признаков чаще всего используются показатели, характеризующие их отклонение от среднего уровня, - общую сумму квадратов отклонений, дисперсию, среднее квадратическое отклонение, а также относительный показатель - коэффициент вариации.
Размах вариаций по каждой из выделенных групп сельскохозяйственных предприятий равны: 6,7; 5,5; 6,2.
Дисперсии среднегодовых удоев молока от коровы по группам равны соответственно:5,761; 2,597; 7,383.
Среднее квадратичное отклонение показывает, что среднегодовой удой молока от коровы по совокупности колеблется в пределах ± 2,267 ц., а коэффициент вариации по совокупности равен ± 5,6% по отношению к среднему уровню.
Разложение вариации по источникам её возникновения – важная составная часть дисперсионного и корреляционного анализ.
РАЗДЕЛ 3. КОРРЕЛЯЦИЯ.
3.1. Теоретические положения.
Важнейшей задачей статистики, наряду с оценкой состояния массовых явлений и выявлением закономерностей их развития, является изучение связей между ними. Задача статистики состоит в том, чтобы выявить само наличие связи в конкретных условиях, а также получить показатели, характеризующие ее силу, степень и характер.
Теоретический и практический интерес представляют в первую очередь причинно-следственные связи, когда одни явления (факторы) выступают причиной изменения других (результаты). Их анализ позволяет, во-первых, объяснить фактическое положение дел, а во-вторых, воздействуя на факторы, добиться изменения результатов желаемом направлении.
Статистическими (корреляционными) называют связи, при которых строго определенному изменению факторного признака х соответствует целый ряд (статистическое распределение) изменений результата у, не вполне определенных, подверженных случайным колебаниям. Эти связи проявляются лишь в среднем, в массовых явлениях; кроме изучаемого фактора на результат воздействуют и другие причины, в том числе носящие случайный характер.
Корреляционные связи варьирующих величин, характерные для массовых общественных явлений, изучают путём сопоставления соответствующих признаков по единицам совокупности или обобщающих (статических) показателей. При этом используют различные приёмы: сопоставление параллельных рядов, статистические группировки, экспериментальный метод, дисперсионный и корреляционный анализ.
Последний мы и будем использовать для определения влияния уровня кормления коров на их продуктивность.
Сущность корреляционного анализа в основном сводится к изучению тесноты связи между признаками.
Если же между ними имеется причинно-следственная связь, проводят корреляционно-регрессионный анализ.
Указанные виды анализа имеют дело не с абсолютными уровнями показателей, а только с их колеблемостью; предметом изучения является сопряженная вариация признаков. Образно говоря, изучается высота волн на море, но не его глубина.
Так как определяемые при изучении статистических зависимостей коэффициенты регрессии и корреляции являются - средними величинами, необходимо соблюдать все требования, предъявляемые к статистическим средним, такие, как качественная однородность совокупности, достаточно большая ее численность и др.
Качественная однородность нужна для получения типических средних. Это условие будет выполнено, если корреляционно-регрессионный анализ применять в сочетании с методом статистических группировок и в первую очередь внутри выделенных благодаря группировке качественно однородных групп.
Парная корреляция возникает, когда изучают связь между двумя признаками, а все остальные факторы (также, возможно, влияющие на результат) игнорируют. Это простейшая и наиболее распространенная разновидность корреляционно-регрессионного анализа.
При парной корреляции результативный признак у рассматривается как функция факторного признака х, то есть у = f(х).
Линейную форму связи выражают уравнением прямой линии ух = ао + a1x.
3.2. Расчётная часть.
Задание 3.
С помощью корреляционного анализа определите влияние уровня кормления коров на их продуктивность по 20 сельскохозяйственным предприятиям. Для этого изобразите на графике зависимость среднегодового удоя молока от расхода кормов на корову в год, постройте линейное уравнение регрессии, рассчитайте коэффициент корреляции и оцените его достоверность с помощью t-критерия Стьюдента.
Решение.
По выборочным данным получаем сведения о среднегодовом удое молока от коровы и расходе на голову строим таблицу 3.1.
Требуется определить зависимость удоев от уровня кормления коров. Для этого строим график (рис. 2.1), который позволит установить зависимость между двумя признаками. Признак среднегодовой удой молока от коровы – является результативным, в признак расход кормов на корову – факторным.
Расход кормов на корову, ц(x)