- 68,3% войдет в диапазон (
- 95,4% попадет в диапазон (
- 99,7% появится в диапазоне (
Соотношение (1) известно как правило «трех сигм».
В нашем случае значения каждого из признаков отлично от правила «трех сигм». Значения второго признака ближе к правилу.
Задача 4.
4,а. Размах вариации R= Х max-Х min. R для первого признака – 204 млн руб., для второго – 140 млн руб.. Размах вариации устанавливает предельное значение амплитуды колебаний признака.
Среднее линейное отклонение по первому признаку равно 35,44, по второму - 28,42222222. В условиях симметричного и нормального, а также близких к ним распределениям между показателями σ и d имеет место равенство: d ≈ 0,8 σ.
Первый признак: d ≈ 0,8*46,04815113 ≈ 36,838520904.
Второй признак: d ≈ 0,8*34,06179026 ≈ 27,249432208
Рассчитанные по формуле значения приблизительно равны значениям, рассчитанным с помощью программы MSExcel.
Дисперсия σn2оценивает средний квадрат отклонений (
Среднее квадратическое отклонение σ показывает, насколько в среднем отклоняются индивидуальные значения признака хi от их средней величины
4,б. Совокупность является количественно однородной по тому или иному признаку, когда выполняется неравенство Vσ≤33%. Коэффициенты вариации по каждому признаку удовлетворяют данному условию. Следовательно, совокупности являются количественно однородными.
4,в. Для оценки надежности (типичности) средней величины х можно воспользоваться значением показателя вариации Vσ. Если его значение невелико, т.е. <40% (как в нашем случае), то индивидуальные значения признака хi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина
4,г. Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. И для первого (0,708678471), и для второго (0,856286955) признака асимметрия левосторонняя.
│As│>0,5. Следовательно, асимметрия существенная.
Задача 5.
Интервальный вариационный ряд распределения единиц совокупности по признаку представлен в таблице 7. Гистограмма и кумулята интервального ряда распределения предприятий изображены на Диаграмме 2.
Для полученного интервального ряда значение моды рассчитывается по формуле:
Значение моды в таблице 3 – Мо=167 млн руб..
Для несгруппированных данных мода - это значение признака с наибольшей частотой появления. В интервальном ряду вычисление моды весьма условно. Поэтому между ними могут быть различия.
Анализ генеральной совокупности.
Задача 1.
На основе имеющихся данных составим таблицу
Таблица 10
Описательные статистики генеральной совокупности
| Среднегодовая стоимость основных производственных фондов, млн руб. | Выпуск продукции, млн руб. | ||
| Столбец1 | Столбец2 | ||
| Стандартное отклонение, σN | 46,83535603 | Стандартное отклонение, σN | 34,64408526 | 
| Дисперсия выборки, σN2 | 2193,550575 | Дисперсия выборки, σN2 | 1200,212644 | 
| Эксцесс, Ek | 0,438466983 | Эксцесс, Ek | -0,36007995 | 
| Асимметричность, As | -0,03462322 | Асимметричность, As | 0,085504193 | 
В нашем случае обе дисперсии совпадают.
Rn =204 млн руб.
RN =6σN
RN=281 млн руб.
Значение размаха вариации различно, поскольку из генеральной совокупности были удалены аномальные значения признаков.
Задача 2.
2,a. Средняя ошибка выборки (µЧ̃ ) первого признака - 8,550926996 млн руб., второго - 6,325115661млн руб..
2,б. Предельная ошибка выборки ΔЧ̃ определяет границы, в пределах которых лежит генеральная средняя
В математической статистике доказано, что: ΔЧ̃=t* µЧ̃.
Составим таблицу
Таблица 8
Предельные ошибки выборки и ожидаемые границы для генеральных средних
| Доверительная вероятность | Коэффициент доверия t | Предельные ошибки выборки | Ожидаемые границы для средних | ||
| для первого признака | для второго признака | для первого признака | для второго признака | ||
| 0,683 | 1 | 8,70660336 | 6,440269376 | 190,92672994≤ | 136,726397324≤ | 
| 0,954 | 2 | 17,82706705 | 13,18667099 | 181,80626625≤ | 129,97999571≤ | 
| 0,997 | 3 | 27,69995902 | 20,48964337 | 171,93337428≤ | 122,67702333≤ | 
Таким образом, предельная ошибка выборки позволяет определить предельные значения показателей генеральной совокупности и их доверительные интервалы.
Задача 3.
Если As<0, то асимметрия левосторонняя, если As>0, то асимметрия правосторонняя. Для первого признака асимметрия левосторонняя (-0,03462322), для второго – правосторонняя (0,085504193).
│As│≤0,25. Следовательно, асимметрия незначительная.
Для первого признака Ek>0. Следовательно, вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средним.
Для второго признака Ek<0. Следовательно, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от Хmax до Хmin.
│Ek│ не значителен. Следовательно, кривая распределения незначительно отличается от нормальной.