4) систематические – ошибки, ведущие по тенденции к завышению или занижению значений показателей. Пример: округление возраста на цифрах, оканчивающихся на 5 и 0.
Систематические ошибки бывают преднамеренными и непреднамеренными.
И ошибки регистрации, и ошибки репрезентативности бывают случайными и систематическими
Существуют два способа контроля над ошибками: логический и арифметический.
Логический предусматривает использование логических, качественных взаимосвязей. Пример: у 8-летнего ребенка не может быть собственных детей. Логический контроль применяется, когда невозможен арифметический.
Арифметический использует количественные зависимости между значениями показателей. Пример: гр.3 = гр.1 + гр. 2.
2.4 Источники информации
Источниками информации для проведения и первичных, и вторичных статистических исследований служат данные
а) внутрипроизводственной и
б) внепроизводственной статистики
В качестве первичных источников информации в первую очередь рассматриваются опросы, интервью.
Вторичными источниками данных являются:
- для внутрипроизводственной статистики: калькуляции, прайс-листы, ведомости выдачи зарплаты, больничные листы, балансы, отчеты о производственно-хозяйственной деятельности, планы предприятий и организаций;
- для внепроизводственной статистики:
материалы государственной и муниципальной статистики (справочники, бюллетени, доклады и т.д.),
журналы,
материалы ведомственной статистики (ЦБ РФ, ГТК, Федеральной службы занятости и т.д.),
частная статистика (союзы и объединения предприятий, ТПП),
материалы научно-исследовательских институтов.
Некоторые национальные и международные источники информации приведены в таблице 2.1.
Таблица 2.1.
Национальные и международные источники информации
Национальные источники | Международные источники |
Журнал «Вопросы статистики» | Zeitschrift “Wirtschaft und Statistik" |
Российский статистический ежегодник | Statistisches Jahrbuch für die Bundesrepublik Deutschland |
Россия в цифрах | Monatsberichte der Deutschen Bundesbank |
Госкомстат РФwww.gks.ru | Statistisches Bundesamt (BRD)www.statistik-bund.de |
Журнал «Статистическое обозрение» | Deutsche Bundesbankwww.bundesbank.de |
Межгосударственный статистический комитет СНГhttp://www.cisstat.com | Bundesministerium für Wirtschft und Technologie (BRD)www.bmwi.de |
Russian Economic Trends http://cep.lse.ac.uk/datalib/ret/ | Organisation for Economic Co-operation and Developmentwww.oecd.org |
Summaries of GOSCOMSTAT's monthly reports prepared in English by IC RATING and put on INTERNET http://feast.fe.msk.ru/koi/informarket/emn/rating/gstat.html | USA. Bureau of Labor Statshttp://stats.bls.govhttp://stats.bls.gov/cpihome.htm |
Всероссийская перепись населения 2002 г.http://www.perepis2002.ru | USA. Department of Commerce, Bureau of Economic Analysishttp://www.stat-usa.gov |
USA. Census Bureauhttp://www.census.gov | |
World Trade Organisation (WTO) www.wto.org | |
Eurostathttp://europa.eu.int/en/comm/eurostat/eurostat.html | |
United Kingdom. Office for National Statshttp://www.emap.co.uk/onshttp://www.ons.gov.uk | |
United Nations, Statistics Division (UNSD)http://www.un.org/depts/unsd |
ТЕМА 3. СТАТИСТИЧЕСКАЯОБРАБОТКАДАННЫХ
Statistische Aufbereitung von Daten Statistical data processing
3.1 Статистическая сводка
Сводка – это второй этап статистического исследования после наблюдения. Он заключается в превращении индивидуальных значений признаков, полученных в ходе наблюдения, в систему статистических показателей, т.е. обобщающих характеристик статистической совокупности по определенному признаку.
Этапы сводки:
1) формулировка задачи;
2) группировка:
- определение количества групп;
- определение величины интервала;
- определение группировочного признака.
3) техническое осуществление сводки;
4) проверка полноты и качества сводки.
Существуют следующие способы сводки:
по форме обработки материала: - централизованный (информация идет снизу вверх по иерархической лестнице, обрабатывается в одном месте);
- децентрализованный (информация собирается на нижнем уровне и там же полностью обрабатывается),
по технике выполнения: - механизированный (с помощью компьютеров);
- ручной.
3.2 Группировка
Это важная часть сводки и один из самых распространенных методов статистики.
Группировка (Gruppierung, Grouping)– это разделение статистической совокупности на части (группы) по определенным существенным признакам.
В отличие от группировки, классификация – это распределение явлений и объектов на определенные группы, классы на основе заранее установленных стандартизированных качественных признаков.
Примеры классификации: международные правила заключения сделок Incoterms, товарная номенклатура внешнеэкономической деятельности ТН ВЭД и др.
Виды группировки:
1) Типологическая группировка
Означает разделение качественно разнородной совокупности на однородные группы. При этом каждая группа будет представлять собой отражение какого-либо одного типа, аспекта исследуемого явления. Выделяется столько групп, сколько существует типов данного явления. Границы интервалов проходят там, где один тип сменяется другим.
Типологическая группировка дает хорошие результаты, если удалось идентифицировать типы явления и найти точки перехода одного типа в другой.
Пример (см. табл.3.1).
Таблица 3.1.
Структура объема платных услуг населению Нижнего Новгорода по их видам в 2000 г.
Вид услуг | Доля в % |
Пассажирского транспорта | 28,6 |
Бытовые | 4,7 |
Системы образования | 10,7 |
Медицинские | 3,0 |
Связи | 15,7 |
Жилищные | 10,6 |
Коммунальные | 18,6 |
Санаторно-оздоровительные | 3,2 |
Прочие | 4,9 |
Источник: Нижний Новгород. Краткий статистический сборник. – Нижний Новгород:
Нижегородский областной комитет государственной статистики, 2001.
2) Аналитическая группировка
Применяется для выявления взаимосвязи между явлениями, т. е. отвечает на вопрос: есть или нет связь?
Признак, по которому все единицы совокупности делятся на группы в аналитической группировке, называется группировочным или факторным, а по которому судят о наличии или отсутствии связи – результативным.
С аналитической группировкой мы встретимся еще в теме корреляционно-регрессионный анализ.
Как правило, при аналитической группировке применяют неравные, все время увеличивающиеся или уменьшающиеся интервалы.
Пример (см. табл.3.2) Установить наличие или отсутствие связи между стажем и производительностью труда. В данном случае факторным признаком х будет стаж, результативным y – производительность труда.
Один из сложных вопросов аналитической группировки – определить количество групп и границы интервалов между группами. Применяют различные методы, например, метод координатной сетки.
В системе координат наносят по оси OXстаж, по оси OY производительность труда (рис.3.1). Всего на рисунке получается 710 точек. Затем ищут так называемые сгущения. Между ними и проводят границы интервалов. Недостаток метода: рисунок сгущений меняется с изменением масштаба.
Таблица 3.2.
Распределение работников по средней производительности труда
Группы работников постажу в годах | Число работников в группе, чел. | Средняя производи-тельность труда в группе (изделий/час) | Плотность распределения |
0-1 | 200 | 2 | 200 |
1-3 | 300 | 4 | 150 |
3-10 | 150 | 5 | 21 |
10-20 | 50 | 3 | 5 |
20 и более | 10 | 1 | (1) |
N=710 |
3) Структурная (вариационная) группировка
Широко применяется для простого сжатия информации по какому-либо признаку. Принципиально отличается от типологической тем, что содержит группы, отличающиеся друг от друга количественно, а не качественно. Пример структурной группировки (табл. 3.3):
Интервалы при структурной группировке, как правило, равные.
Величина равного интервала определяется по формуле:
Xmax и Xmin – максимальное и минимальное значения признака.
Таблица 3.3
Данные о денежных доходах населения Нижегородской области в 1996 г.
Группы населения (по 10% каждая) | Доля оплаты труда и дохода от предпринимательской деятельности ко всем доходам, % |
1 (группа с низшим доходом) | 68,4 |
2 | 75,8 |
3 | 76,1 |
4 | 75,6 |
5 | 76,4 |
6 | 77,8 |
7 | 79,8 |
8 | 79,9 |
9 | 81,7 |
10 (группа с высшим доходом) | 78,0 |
Источник: данные НОКГС
Число же групп можно определить разными способами:
- по формуле Стерджесса
k – число групп;
N – объем ряда (число единиц совокупности).
Применение формулы Стерджесса дает хорошие результаты при большом объеме ряда и распределении, близком к нормальному.
- на основе применения среднего квадратического отклонения – например, при величине интервала i = 0,5 σ совокупность разбивается на 12 групп, при i = σ – на 6 групп со следующими интервалами:
от
- 3σ до - 2σот
- 2σ до - σот
- σ доот
до + σ