6. Статистический график всегда ломаная линия или диаграмма.
4.1 Уровневые графики (гистограмма, полигон распределения)
Для таких графиков важно соблюдать два правила их построения:
1. Количественное значение группы должно следовать за изменением количественной характеристики признака (распространение признака по оси абсцисс первично).
2. При равных интервалах признака по оси ординат откладываются частоты, при неравных – плотность распределения.
Характерными представителями уровневых графиков являются гистограмма (рис.1) и полигон распределения.
Для общего вида гистограммы характерно следующее:
· предельная высота ограничена максимальной частотой, максимальной частостью или плотностью распределения;
· гистограмма характеризует не только интервалы распределения признака (основания прямоугольников), но и распределение объема признака для тех или иных интервалов (площадь прямоугольника);
· вид линии, ограничивающей гистограмму сверху, определяет ресурсы по объему признака;
· вся площадь прямоугольника S по максимальной высоте гистограммы для всего распределения признака характеризует матрицу объема признака.
Гистограмма наглядно иллюстрирует распределение признака, причем двояко:
· долей площади каждого прямоугольника
· матрицей
, где S – площадь матрицы.Гистограмма показывает как изменяется объем признака. Для оценки изменений площади соседних прямоугольников суммируются (возможно нарастающим итогом) и эта сумма относится к общему объему признака (сумме площадей всех прямоугольников).
Правильно построенная гистограмма (в пределах установленных масштабов) позволяет выделить генеральную совокупность по объему признака прямым или обратным порядком. Прямой порядок выделения генеральной совокупности сопряжен с нарастающей динамикой объема признака (S1 + S2 + S3 + S4), обратный (S4 + S3 + + S2 + S1) – с убывающей.
Построить гистограмму можно только для интервального ряда распределения, и в этом состоит специфичность гистограммы.
Более универсальным является второй вид уровневого графика – полигон распределения. В дискретных рядах каждому определенному значению признака соответствует своя частота (частость), что отражается на оси абсцисс точками, а не интервалами, а по оси ординат – целыми значениями частоты или дробными частости. В этом случае полигон распределения будет представлен ломаной линией.
Для интервального ряда получение полигона распределения предполагает соединение середин верхней линии гистограммы.
Для смешанного ряда построение полигона распределения предполагает соединение середин верхних линий гистограмм с высотой дискретного значения признака.
Если есть возможность закодировать цифрами стандартную номенклатуру по атрибутивному признаку, то эти цифры могут быть зарегистрированы на оси абсцисс, и это позволит построить полигон распределения (так называемый кодовый полигон распределения).
Универсальность этих графиков снижает их потенциальные возможности по сравнению с гистограммами. Полигон также характеризует распределение признака, но не так конкретно, как гистограмма (затруднен процесс расчета всех площадей). Изменение объема признака регистрируется в целом и нарастающим итогом, поэтому полигон распределения не позволяет выделить генеральную совокупность.
Тем не менее, полигон распределения регистрирует точку или момент перехода количества в качество в процессе нарастания объема признака.
4.2 Интегральные графики
Интегральные графики в экономике представлены главным образом кумулятами. Общей особенностью построения кумулят является накопление не только признака, но и частот по абсциссе и ординате. Различают следующие виды кумулят: полная и неполная; восходящая (прямая) и убывающая (обратная).
Кумуляты аналогичны по виду полигона распределения, а поэтому применимы для всех вариантов рядов распределения.
Полные кумуляты строятся для всех рядов с полным нарастанием частот (без ограничений). Неполные кумуляты строятся и для интервальных рядов, и для смешанных. Первые формируются либо в пределах всего ряда, либо учитываются только характерные группы интервалов (выделенные по минимальному, серединному или максимальному значению интервала), вторые – в пределах всего ряда, но учитываются не все частоты, а только те, которые выше установленного регламента.
Пример. По геологически однородному участку золотой россыпи получены следующие результаты опробования (447 проб):
Содержание, г/т | 0 | 0-0,1 | 0,1-1 | 1-2 | 2-3 | 3-5 | 5-10 | 10-20 | |
Число проб | 13 | 32 | 51 | 84 | 116 | 96 | 32 | 13 | |
Содержание, г/т | 18,7 | 18,8 | 19,4 | 19,9 | 20 | 29,5 | 47,1 | 92 | 193,4 |
Число проб | 1 | 1 | 2 | 1 | 1 | 1 | 1 | 1 | 1 |
Определить критическое содержание* золота в пробе, полностью учитываемое при подсчете запасов по этому участку (избыточное содержание будет отнесено к запасам всего месторождения). Установить кондиции для балансовых и забалансовых запасов. Оценить достоверность графиков для подсчета категории запасов.
Решение. Все эти задачи можно решить графически путем построения двух полных кумулят: прямой и обратной. Построение кумулят требует проведения предварительной очистки данных от ложных («грязных») проб, а также обоснования критического содержания по отношению к среднему. Примем, что критическое содержание выше среднего в 10 раз. Кроме того, необходимо выделить ураганные пробы, в которых содержание выше критического.
Необходимую информацию и результаты расчетов сведем в таблицу, где столбцы 1 и 3 содержат исходную информацию, а остальные – расчетную (полужирным шрифтом выделены искомые значения).
Содержание золота, г/т | Среднее по классу, г/т | Число проб в классе | Сумма со-держанийв классе, г/т | Нарастающая сумма | Убывающая сумма | ||
г/т | % | г/т | % | ||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
0 | 0 | 13 | 0 | 0 | 0 | 1742,9 | 100 |
0-0,1 | 0,05 | 32 | 1,6 | 1,6 | 0,1 | 1742,9 | 100 |
0,1-1 | 0,55 | 51 | 28,1 | 29,7 | 1,7 | 1741,3 | 99,9 |
1-2 | 1,5 | 84 | 126 | 155,7 | 8,8 | 1713,2 | 98,3 |
2-3 | 2,5 | 116 | 290 | 445,7 | 25,6 | 1587,2 | 91,3 |
3-5 | 4 | 96 | 384 | 829,7 | 47,6 | 1297,2 | 74,4 |
5-10 | 7,5 | 32 | 240 | 1069,7 | 61,5 | 913,2 | 52,4 |
10-20 | 15 | 13 | 195 | 1264,7 | 72,5 | 673,2 | 38,5 |
18,7 | 18,7 | 1 | 18,7 | 1283,7 | 73,7 | 478,2 | 27,5 |
18,8 | 18,8 | 1 | 18,8 | 1302,2 | 74,6 | 459,5 | 26,3 |
19,4 | 19,4 | 2 | 38,8 | 1341 | 77,0 | 440,7 | 25,4 |
г/т | % | г/т | % | ||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
19,9 | 19,9 | 1 | 19,9 | 1360,9 | 78,1 | 401,9 | 23,0 |
20 | 20 | 1 | 20 | 1380,9 | 79,3 | 382 | 21,9 |
29,5 | 29,5 | 1 | 29,5 | 1410,4 | 81,0 | 362 | 20,7 |
47,1 | 47,1 | 1 | 47,1 | 1457,6 | 84,6 | 332,5 | 19,0 |
92 | 92 | 1 | 92 | 1549,5 | 88,9 | 285,4 | 15,4 |
193,4 | 193,4 | 1 | 193,4 | 1742,9 | 100 | 193,4 | 11,1 |
_________________________________Примечание. Такая запись указывает на то, что исходная информация не содержит грязных проб, а распределение содержания по уровням ряда соответствует геологической классификации проб. Тем самым пробы, представленные в столбце 3, являются чистыми. |
Заполнение столбцов в расчетной части таблицы выполняется следующим образом:
· Столбец 2. Уровни этого ряда представляют собой середины интервальных значений столбца 1.
· Столбец 4.Произведение соответствующих строк столбцов 2 и 3. Каждый уровень ряда этого столбца имеет частное наименование (граммов на тонну) или характеризует удельный объем изучаемого признака (наличие золота в руде). Это возможно, так как данный признак является произведением двух стандартных (цензовых) признаков.
· Столбец 5. Уровни этого ряда получаются путем последовательного суммирования уровней предыдущего ряда. Сумма регистрируется нарастающим итогом.
· Столбец 6. Значения могут быть получены прямым и обратным способом. Прямой способ предполагает выражение в относительном измерении уровней столбца 4 и последующего их наращивания. Обратный способ применим только в пределах всей совокупности. Тогда предельное значение столбца 5 принимается за 100 % и каждый из уровней этого ряда затем соотносится с предельным значением.
· Столбец 7. Уровни этого ряда набираются как разности; последние получаются последовательным вычитанием из конечного значения столбца 5 значений столбца 4, начиная с первого уровня.
· Столбец 8. Процентное выражение убывающей суммы определяется обратным порядком по аналогии со столбцом 6.
Таким образом, среднее содержание по всем 447 пробам составляет 3,9 г/т. Тогда критическое содержание 39 г/т. Тем самым, к ураганным относятся пробы с содержанием 47,1, 192 и 193,4 г/т.
Долю запасов с ураганными пробами можно выделить двумя способами:
· прямым, по убывающей кумуляте (в столбце 8 последние три строки регистрируют данные по ураганным пробам, верхнее соответственно искомое значение 19 %);