Объем выборочной совокупности зависит от множества факторов, в том числе от целей и задач, теоретической модели, гипотез и методов исследования, степени однородности генеральной совокупности, наконец, требующейся точности получаемой информации.
Репрезентативность — свойство выборочной совокупности представлять характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности — мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности.
Наряду с термином «ошибка репрезентативности» в отечественной литературе можно встретить другой — ошибка выборки — отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.
Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых статистических погрешностей. В.И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5%-ной ошибки (табл.):
Таблица
Расчеты репрезентативной выборки
Объем генеральной совокупности | 500 | 1000 | 2000 | 3000 | 4000 | 5000 | 10000 | 100000 |
Объем выборки | 222 | 286 | 333 | 350 | 360 | 370 | 385 | 358 |
Формулы расчета выборочной совокупности
при собственно случайной степени отбора
N – генеральная совокупность;
n – выборочная совокупность;
– ошибка выборкиДля гомогенной совокупности (
- дисперсия)При повторном отборе n= , | При бесповторном отборе n= , |
Для гетерогенной совокупности (q – доля признака)
При повторном отборе n= , | При бесповторном отборе n= , |
При написании научного отчета и публикации статьи в академическом журнале от авторов исследования всегда требуют четких разъяснений относительно самого исследования и выборочной совокупности: кто и когда проводил исследование, какие методы исследования использовались, каковы тип, объем и характер выборки, ошибка репрезентативности, состав выборочной совокупности по главным параметрам (например, пол, возраст, национальность, образование), контроль данных и др.
Принципы выборки описываются не только для метода опроса, но и для каждого метода, используемого в исследовании: анализ документов, наблюдение и т.д.
Следующий шаг - обоснование методов сбора эмпирических данных. Для этого исследователь должен указать технико-организационные параметры используемых методов сбора данных (МСД). Так, если речь идет об опросе, то следует отметить, применяется ли анкетирование, интервьюирование или смешанная стратегия; где проводится опрос: по месту жительства, месту работы или в целевой аудитории (в кино, на приеме в ведомственной поликлинике, в заводских пунктах службы быта, в профилактории и т.п.), какая конкретно разновидность анкетирования применяется: раздаточная, курьерская, на рабочих местах; групповое (аудиторное) анкетирование; в присутствии анкетера или без него; почтовое, прессовое анкетирование. Столь же подробно характеризуется и методика интервьюирования: к программе желательно приложить инструкции для анкетеров (интервьюеров) и бланки вопросников.
Важным моментом подготовки исследования и сбора информации является разработка инструментария: анкет, бланков интервью, учетных карточек, дневников наблюдений и т.д.
Проектируя методическое обеспечение программы исследования, необходимо учитывать следующие обстоятельства:
1. Оперативность и экономичность исследования не должны обеспечиваться в ущерб качеству данных. Это главное требование, соблюдение которого характеризует профессиональное мастерство.
2. Ни один метод не является универсальным, но имеет свои, четко очерченные познавательные возможности.
3. Не существует вообще «хороших» и «плохих» методов, есть методы, адекватные и неадекватные исследовательским задачам.. Выбрать надежный метод — значит логически обосновать его соответствие поставленной задаче.
4. Надежность метода обеспечивается не только его обоснованностью, но и соблюдением правил его применения.
5. Адекватность и надежность метода проверяется в пробном (пилотажном) исследовании.
6. Каждый метод при его испытании в пробном исследовании ведет себя по-своему, поэтому требует специальных правил апробации.
Также в процедурно-методологическом разделе программы КСИ обосновываются методы обработки и анализа данных: способ обработки эмпирической информации (ручной или машинный); содержание работы по подготовке информации к обработке (контроль качества заполнения анкет, ручная кодировка ответов на открытые вопросы, редакция анкет, контроль на логическую непротиворечивость и т.п.); объем подготовительной работы и примерные затраты на ее выполнение.
Собранные в эмпирическом исследовании факты получили в социологии название данных.
С эмпирическими данными можно производить следующие операции: 1) подготавливать их для обработки; шифровать, кодировать и т.д.; 2) обрабатывать (вручную или с помощью компьютера); табулировать, рассчитывать многомерные распределения признаков, классифицировать и т.д.; 3) анализировать; 4) интерпретировать.
Этап анализа данных — комплекс процедур, составляющих стадии преобразования данных. В качестве основных выделяются: этап подготовки к сбору и анализу информации; оперативный этап первичной обработки данных, проверки надежности информации, формирования описательных данных, их интерпретации; результирующий этап обобщения данных анализа и реализации прикладной функции. На каждом этапе решаются относительно самостоятельные задачи. Вместе с тем ход анализа в исследовании отличается достаточно высокой гибкостью. Наряду с общей и установленной последовательностью этапов складываются определенная цикличность и итеративность ряда процедур, возникает необходимость возврата к прежним этапам. Так, в ходе интерпретации полученных показателей и проверки гипотез для уточнения (объяснения) формируются новые подмассивы данных, изменяются или строятся новые гипотезы и показатели. Соответственно, представленные в схемах этапы и процедуры анализа задают лишь общее направление цикла анализа данных.
Анализ данных представляет собою своеобразную «вершину» всей процедуры социально-политического исследования, ее результатом, ради которого все, собственно, и проделывается. Методы анализа данных описываются в соответствии с разрабатываемой методикой сбора информации. Указываются такие универсальные процедуры анализа, как получение первичных (линейных) распределений ответов на вопросы анкеты; двойные (парные) связи между изучаемыми признаками (переменными); коэффициенты связи, которые будут получены на ЭВМ.
Анализ данных — основной вид работ социально-политического исследования, направленный на выявление устойчивых, существенных свойств, тенденции изучаемого объекта; включает выделение и расчет показателей, обоснование и доказательство гипотез, построение выводов исследования. На его основе поддерживается логическая стройность, последовательность, обоснованность всех процедур исследования.
Основное назначение анализа данных: зафиксировать информацию об изучаемом объекте в виде признаков, определить ее надежность, выработать объективные и субъективно-оценочные характеристики и показатели исследуемого процесса, обосновать и проверить гипотезы, обобщить результаты исследования, установить направления и формы их практического применения.
Основные нормативные требования: руководящая роль теоретических требований, методологических принципов; концептуальная взаимосвязь всех этапов анализа с программой исследования, обеспечение полноты, надежности информации и процедур достоверности результатов исследования; систематизация, сжатие и более полное выражение информации за счет использования на всех этапах анализа логических, математико-статистических и информационных методов, эффективных процедур, современных технических средств; итеративность процесса анализа, повышение уровня обоснованности информации на каждом следующем этапе исследования; всемерное использование компетенции специалистов, развитие творческой инициативы исполнителей.
Программа анализа данных является составной частью программы КСИ. Ее ведущие задачи: определение вида и состава необходимой информации, определение способов, средств ее регистрации, измерения, обработки и преобразования, обеспечение надежности данных, определение форм интерпретации, обобщение данных, установление способов практического применения результатов исследования.