Cоціологія
Поняття вибірки, її аналіз і побудова
Ймовірнісний підхід до побудови вибірки. Одношаблева випадкова вибірка. Принципи районування (стратифікації) і кластеризації („гнізд”). Багатошаблева комбінована вибірка. Цілеспрямований підхід до побудови вибірки: принцип типовості, принцип квот
Вибірковий підхід виник як альтернатива суцільному опитуванню, найтиповішими прикладами якого є перепис населення та референдум.
У практиці емпіричних соціологічних досліджень суцільні опитування провадяться дуже рідко: здебільшого у локальних дослідженнях, коли об'єкт дослідження репрезентований невеликою групою людей (одне підприємство тощо).
Основною особливістю опитувань громадської думки є те, що опитується, звичайно, невелика частина певної групи населення, а висновки поширюються на всю групу. Яким має бути співвідношення між цією групою загалом і тією частиною групи, від якої фактично і було одержано інформацію, — основна проблема вибірки.
Поняття «вибірка»
Термін «вибірка» за наших часів в емпіричній соціології масових опитувань має два основних досить сталих значення.
1.В одних випадках поняття «вибірка» використовується як синонім поняття «вибіркова сукупність» — частина населення (популяції), яка, власне, і зазнає опитування, з тим, щоб одержані результати можна було б поширити на досліджувану популяцію загалом.
2.В інших випадках під «вибіркою» мають на увазі процес відбору одиниць спостережень (технологія, способи і методи такого відбору визначають тип вибірки) — у цих випадках слово «вибірка» є синонімом процедурної категорії — «відбір одиниць спостереження».
Побудова вибірки при підготовці проекту конкретного соціологічного дослідження зводиться до розв'язання трьох основних проблем:
1)визначення обсягу вибірки — кількості чоловік, яких треба опитати для одержання якісної інформації;
2)визначення типу вибірки — побудова конкретної схеми процедури відбору;
3)оцінка якості вибірки — визначення ймовірності і міри точності, з якими результати опитування вибіркової сукупності можна переносити на ту чи іншу частину населення.
Проблеми перелічені у тому порядку, в якому вони найчастіше постають перед розробниками проекту. Але розв'язуватися вони повинні у зворотній послідовності. Питання якості вибірки є ключовим — з нього розпочинається розробка вибірки (бо саме воно визначає підходи до розв'язання питання про обсяг та тип вибірки), і відповідь на це питання після завершення збору даних є засадовою для аналізу одержаної інформації та інтерпретації результатів.
Визначення якості вибірки включає опис низки умов, які дають змогу оцінити валідність, надійність та репрезентативність вибіркової сукупності стосовно об'єкта дослідження.
Репрезентативність. Репрезентативністю зветься властивість вибіркової сукупності відтворювати характеристики генеральної сукупності. Відхилення вибіркової сукупності від генеральної за якимись основними характеристиками називається помилкою репрезентативності: чим більша величина цих відхилень, тим більша помилка репрезентативності. Зрозуміло, що вибірка не може буквально відтворити генеральну сукупність. Основне завдання дослідника — враховувати помилку репрезентативності під час інтерпретації та узагальнення результатів опитування, проведеного на підставі вибіркової сукупності. Тому дослідник повинен вміти кількісно визначати цю помилку, величина якої обчислюється залежно від типу вибірки.
При аналітичному підході до вибірки треба враховувати наступні необхідні вимоги: 1) групи повинні розрізнятися за основною диференційованою ознакою (гіпотетичним фактором); 2) за рештою параметрів (віком, статтю, рівнем освіти, характером діяльності тощо) групи мають бути максимально ідентичні. Якщо дослідникові пощастило набрати досить ідентичні групи, які розрізняються лише за однією диференційованою ознакою, то чисельність таких груп може бути невеликою (50—100 осіб).
Надійність та валідність. Надійність та валідність — основні параметри визначення якості інформації, одержаної в результаті проведення емпіричного дослідження. Під надійністю розуміють певну гарантію, що одержаний результат правильно відбиває досліджувану дійсність. Валідністю (обґрунтованістю) інформації називається підтвердження (доказ), що досліджувалися (вимірювалися) саме ті явища, які соціолог передбачав дослідити.
На якість інформації (надійність та валідність даних) справляють вплив особливості різноманітних етапів емпіричного дослідження (вихідні теоретичні передумови, якість інструментарію, організація контролю роботи інтерв'юерів і т.д.). Особливу роль у забезпеченні надійності та валідності даних відіграють особливості формування вибірки. Ми зупинимося на проблемі впливу особливостей вибіркового підходу на надійність і валідність одержаної в результаті дослідження інформації.
Надійність інформації на цьому етапі формування вибірки забезпечується врахуванням випадкових помилок.
Випадкові помилки неминучі через неоднорідність досліджуваного контингенту. Якість дослідження визначається спроможністю соціолога обчислити величину випадкової помилки і врахувати її під час поширення висновків, одержаних на підставі опитування частини певної групи людей, на всю її сукупність.
Валідність (обґрунтованість) даних, як зазначалося вище, характеризує рівень виміру саме того, що передбачалося виміряти. До зниження валідності можуть призвести не тільки помилки інструментарію (про що йшлося у відповідному розділі), а й похибки вибірки, зокрема, систематична помилка чи відхилення вибірки. Наприклад, якщо відбір респондентів провадитиметься у районі розташування військової частини, то можна сподіватися, що у вибірці військовослужбовців може бути більше, ніж це характерно для генеральної сукупності.
При повторному дослідженні дані можуть бути достатньо стабільними, але як у першому, так і в другому випадку на результати цей (військовий) фактор1 впливатиме більшою мірою, ніж його відчуває генеральна сукупність. Те саме, згадавши наведений виш£ приклад, можна сказати й про такі місця опитуванні, як черга (у робочий час доби у черзі значно більше представників непрацюючих категорій населення, ніж у структурі населення загалом), чи зупинка автобуса. Необґрунтований вибір точок опитування найчастіше призводить саме до систематичної помилки.
Слід зазначити, що надійність та валідність — досить незалежні один від одного параметри, тому у разі оцінки якості інформації дослідник повинен враховувати обидві ці характеристики; дані можуть бути плідні, але ненадійні, і навпаки, дослідник може одержуєте досить стабільні (надійні) результати, але вони не валідні стосовно предмета аналізу.
Щоб уникнути впливу випадкових та систематичних помилок (або, у крайньому разі, обчислити їх величину і врахувати її під час інтерпретації результатів), необхідно бути обізнаним з основними характеристиками генеральної сукупності, на яку дослідник поширюватиме висновки, одержані в результаті опитування вибіркової сукупності.
Головне завдання дослідника на етапі складання вибірки — правильно побудувати модель вибіркової сукупності (таким чином, щоб за своєю структурою вона відповідала генеральній сукупності), а на етапі інтерпретації результатів врахувати усі похибки, яких було допущено під час формування вибірки. Якість інформації у кінцевому підсумку визначається не відсутністю помилок і похибок (уникнути яких практично неможливо), а створюваними дослідником умовами, що дають змогу врахувати вплив цих помилок на кінцевий результат.
Однощаблева випадкова вибірка
Ймовірнісний підхід нерідко називають також випадковим чи стохастичним, оскільки він передбачає випадковий відбір одиниць спостереження із загального переліку (списку) одиниць генеральної сукупності. Основне правило при випадковому відборі — однакова ймовірність кожної одиниці генеральної сукупності потрапити до вибірки. При педантичному додержанні цієї умови реалізується основна перевага випадкової вибірки: елементи генеральної сукупності виявляються репрезентованими у вибірці з ймовірностями, які наближаються до їх розподілу у генеральній сукупності. При цьому чим менше ознака розсіяна у генеральній сукупності і чим більший обсяг вибіркової сукупності, тим менша помилка репрезентативності. Такий результат є виявленням закону великих чисел, що дає можливість, знаючи дисперсію фіксованих характеристик та заздалегідь визначивши припустиму помилку репрезентативності, розрахувати потрібний обсяг вибіркової сукупності.
Відпрацьовані різноманітні технічні процедури випадкового відбору: механічний відбір, використання таблиці випадкових чисел, розрахунок кроку відбору та ін.
Механічний відбір передбачає складання карток із номерами, кожний з яких відповідає номерові одиниць відбору у загальному переліку. Усі картки перемішуються у барабані і витягуються з нього у випадковому порядку. У сучасній практиці ця процедура практично не використовується, бо вимагає певних додаткових організаційних витрат (підготовка карток чи кульок), обов'язково ідентичних за своїми фізичними параметрами, механічний пристрій для їх рівномірного перемішування і т. д.). Однак саме така процедура забезпечує випадкову повторну вибірку. Повторною називається така вибірка, коли обраний елемент (картка) знову повертається до барабану, і є певна ймовірність, що вона буде обрана ще раз. Строго кажучи, теоретично тільки така вибірка дає змогу розраховувати під час аналізу даних статистичні коефіцієнти зв'язків та значимості. Адже на практиці, зрозуміло, ніхто не буде опитувати одного і того самого респондента двічі, навіть якщо його номер двічі потрапляє до вибірки.