Смекни!
smekni.com

Поняття вибірки, її аналіз і побудова (стр. 2 из 3)

Таблиці випадкових чисел дають можливість з допомогою комп'ютерних програм автоматизувати випадковий відбір одиниць спостереження на основі таблиці випадкових чисел.

Найчастіше для випадкового відбору використовують розрахунок кроку відбору. Це робиться так. Одиниця відбору із списку генеральної сукупності позначаються за суцільною нумерацією. Дослідник повинен стежити, щоб у черговості не було жодної закономірності. Загальна кількість одиниць генеральної сукупності (припустимо, 10 000 одиниць) ділиться на кількість одиниць вибіркової сукупності (припустимо, 2000 чоловік); крок відбору дорівнює 5. Із списку генеральної сукупності відбирається кожний п'ятий номер. Звичайно, відбір розпочинають не з першого номера. Величина кроку відбору ділиться навпіл; якщо ця величина не є цілим числом, її округлюють до більшого значення. У цьому випадку слід п'ять розділити на два, одержуємо 2,5; отже, розпочинати вибір треба з третього номера; наступний номер відбору буде восьмий (3 + 5 = 8), далі — тринадцятий (8 + 5 = 13) і т.д.

Процедури випадкового відбору досить відпрацьовані і, з технічної точки зору, не складні для соціологів. Основні проблеми однощаблевого випадкового відбору обумовлені практичними перешкодами на шляху виконання теоретичних вимог.

Основна проблема полягає у складанні загального списку генеральної сукупності, головним чином, в одержанні необхідних відомостей для підготовки такого списку.

Друге коло проблем проведення випадкової вибірки пов'язане із досяжністю респондентів. Ці проблеми викликані протиріччям між вимогою опитувати саме тих людей, які потрапили до випадкового відбору (на основі однакової можливості кожного потрапити до вибірки), з одного боку, і практично неможливістю опитати певну частину одержаної вибіркової сукупності — з іншого. Як правило, недосяжність частини вибіркової сукупності (до 10—15%) пояснюється такими причинами: відсутність (тимчасова чи постійна) за вказаними адресами, відмова респондентів від участі в опитуванні і т. д.

Третя проблема однощаблевої випадкової вибірки визначається занадто розсіяним (у просторі) полем респондентів. Якщо у випадковому порядку відібрати 1000 осіб, які мешкають на території країни, то одержані адреси будуть досить віддалені одна від одної, і організаторам важко буде знайти інтерв'юерів, які б погодились опитувати осіб, локалізованих занадто далеко одна від одної (у кращому випадку ця проблема може розв'язуватися за рахунок підвищення оплати праці інтерв'юерів та транспортних витрат, що, природно, призводить до істотного подорожчання дослідження).

Таким чином, вимога однакової ймовірності кожної одиниці генеральної сукупності потрапити до вибірки є найбільшою перевагою ймовірнісного підходу з теоретичної точки зору (оскільки дає змогу звести до мінімуму випадкові та систематичні помилки і визначити загальну помилку репрезентативності) і найбільшим його недоліком з практичної точки зору (у практиці масових опитувань ця вимога є часто нездійсненною або ж такою трудомісткою, що організаційні витрати стають невідповідними очікуваним результатам).

Розв'язання цього протиріччя можливе шляхом багатощаблевого випадкового відбору.

При багатощаблевому випадковому відборі генеральна сукупність у результаті попереднього аналізу об'єкта дослідження розбивається на підсукупності — одиниці відбору; з них на першій стадії у випадковому порядку відбирається частина підсукупностей, а з відібраних під-сукупностей відбираються одиниці спостереження. При потребі кількість щаблів можна збільшити.

Здійснення багатощаблевого відбору відзначається двома особливостями.

1. Помилка репрезентативності на кожному щаблі зростає; але, головне, що ця помилка може бути врахована дослідником; невраховані помилки зводяться до мінімуму.

2. Багатощаблевий підхід вимагає попереднього аналізу та систематизації об'єкта дослідження. Під систематизацією розуміють групування одиниць відбору. Іншими словами, всі одиниці генеральної сукупності треба попередньо розбити на групи.

Принцип районування (стратифікації)

Існує два основних види класифікації (групування) генеральної сукупності: районування (стратифікація) і кластеризація (метод гнізд, серійна вибірка).

Районована (стратифікаційна) вибірка передбачає попереднє групування одиниць генеральної сукупності за відмінними між собою типами.

Засадовою стосовно класифікації є ознака (чи сукупність ознак), за якою респонденти істотно відрізняються один від одного; при цьому саме така ознака, на думку дослідника, може справляти істотний вплив на досліджуване явище. Таким чином, при виборі критерію стратифікації (районування) дослідник керується двома особливостями:

1)ця характеристика повинна справляти вплив на досліджуване явище;

2)за цією характеристикою одиниці сукупності мають розрізнюватися.

Наприклад, при вивченні ставлення до приватизації можна передбачити, що тип підприємства, на якому працюють респонденти (державне чи приватне), істотно впливатиме на їхнє ставлення до приватизації. Дослідникові також відомо, що частка людей, які працюють на приватних підприємствах, незначна, і при механічному випадковому відборі ймовірність їх занесення до вибірки — досить низька. У такому випадку всі підприємства поділяються на групи залежно від форми власності, а потім із кожного типу відбираються респонденти пропорційно чисельності цього контингенту в генеральній сукупності. У більшості великомасштабних опитувань громадської думки за національними вибірками первинна стратифікація здійснюється за географічною локалізацією респондентів (звідси й синонімічна назва цього принципу — районування).

У статистичному розумінні районування відповідає виокремленню такої кількості і таких статистичне однорідних груп, щоб дисперсія заданих параметрів всередині одержаних груп була меншою, ніж між ними.

Принцип кластеризації («гнізд»)

Кластерний («гніздовий») спосіб попередньої класифікації об'єкта у певному розумінні е протилежним районованому. Якщо при районуванні дослідник виокремлює різнотипові підсукупності, то при гніздовій вибірці генеральна сукупність розбивається на однотипові групи («гнізда»), всередині яких містяться різнорідні одиниці спостереження. Такими «гніздами» можуть бути школи, підприємства, сім'ї, колективи, поштові відділення, виборчі дільниці та інші організації, які тим чи іншим чином інтегрують групи людей, а дослідник вважає, що ці кластери досить однотипні.

Використовуючи принцип кластеризації, дослідник повинен керуватися двома основними положеннями:

1) усі одиниці генеральної сукупності мають бути розподілені між «гніздами»;

2) основні характеристики «гнізд» мусять бути максимально ідентичними за заданими параметрами.

При використанні гніздової вибірки у межах «гнізда» можна проводити суцільне опитування, а можна — вибіркове, залежно від чисельності та однорідності сукупностей «гнізд».

Багатощаблева комбінована вибірка

Звичайно, ці підходи (районований та гніздовий) у науково-методичній літературі протиставляються один одному. Але у сучасній практиці проведення масових великомасштабних досліджень при побудові вибірки найчастіше використовуються обидва ці принципи. Застосовуючи послідовно на різних щаблях відбору кожний з таких принципів, дослідник домагається підвищення репрезентативності вибіркової сукупності за різними характеристиками, які, на думку дослідника, можуть справити принциповий вплив на досліджуване явище.

Прикладом багатощаблевої випадкової вибірки є вибірка дорослого населення Сполучених Штатів, за якою провадить щомісячні опитування-інтерв'ю (їасе-іо-їасе) Інститут Геллапа. На першому щаблі провадиться стратифікація населених пунктів: місто — село; в свою чергу, міське населення стратифікується за типом міста, а сільське населення районується за сегментами забудови. Із страт відбираються 350 «точок опитування» на підставі принципу випадкового відбору. Кожний інтерв'юер одержує карту-схему «точки опитування» із позначеною точкою початку «маршруту» та «інструкції» щодо встановлення домоволодінь (будинків, квартир) відповідно до принципів маршрутного методу, а також інструкції з відбору респондента в сім'ї (відповідно до вимог випадкового відбору). Для роботи у кожній точці запрошується інтерв'юер, який не мешкає у цій місцевості. Разом опитується близько 1000 чоловік.

Основу вибірки становлять домовласники, тобто із генеральної сукупності дорослого населення заздалегідь виключаються: особи, які перебувають у в'язниці, лікарні; особи, що проживають у готелях або наймають квартиру; особи, які проживають на військових базах, а також у гуртожитках навчальних та релігійних закладів.

Після завершення опитування дані за основними демографічними характеристиками порівнюються з даними останнього перепису; результати опитування зважуються з урахуванням даних перепису. Це дає змогу підвищити «репрезентативність» осіб, яких важко застати вдома. Ці процедури спрямовані на приведення вибірки у відповідність до основних параметрів дорослого населення (старше 18 років), яке мешкає у приватних будівлях.

Оскільки побудова цієї вибірки Інституту Геллапа визначається принципами випадкового відбору на кожному із щаблів, це дає змогу дослідникам розраховувати помилку вибірки і в щомісячних публікаціях додавати до результатів опитування таблицю, яка дає змогу читачам «правильно читати» одержані дані, враховуючи випадкову помилку вибірки (наприклад, «такої» думки додержуються 23% «плюс-мінус» 4%).

Таким чином, багатощаблевий випадковий відбір дає змогу визначити помилку репрезентативності на кожному щаблі і, відповідно, загальну помилку репрезентативності. Чи, навпаки, на підставі заздалегідь заданої помилки обчислити обсяг вибіркової сукупності. Природно, слід зважати на умовність правильності розрахунків. Ця умовність визначається тими критеріями, показники яких враховувалися (а особливо тими, які не враховувалися) при здійсненні типології об'єктів репрезентації.