Логічний зміст і практичну значущість статистичних моделей взаємозв'язку слід розглядати саме в площині співвідношення причинності і зв'язків, що вимірюються статистичними методами. Суть причинності полягає в породженні одного явища іншим. Причина — активна основа, що примушує інше явище змінюватися. Сама по собі причина не визначає наслідку. Останній залежить і від умов, у яких діє причина. Через нерозрізненість причин і умов при моделюванні вони об'єднуються в одне поняття «фактор», а наслідок розглядається як результат дії факторів. Отже, в рамках моделі досліджується детермінованість результату факторами.
Методологічні проблеми побудови моделей взаємозв'язку можна об'єднати в дві групи:
- формування ознакової множини моделі, себто визначення кількості факторів та їх числових еквівалентів;
- модельна специфікація — вибір функціонального виду моделі, ідентифікація та оцінювання параметрів.
При формуванні ознакової множини моделі різноманітні прояви причинно-наслідкових зв'язків доцільно представляти візуально у вигляді спеціальних конструкцій — графів зв'язку, елементами яких е вершини та орієнтовані ребра (дуги). Вершини графа відповідають ознакам, а дуги показують відношення між ознаками. На рис. 2.1 ілюструється граф зв'язку чотирьох ознак. За дугами графа можна простежити систему відношень між ними: х впливає на у прямо, безпосередньо, z — прямо та опосередковано двома шляхами:
та . У такій логічній конструкції ознака у є результатом, а х, z і — факторами, що визначають результат.Граф відображує теоретично обґрунтовану систему відношень між ознаками. Кожна ланка цієї системи розглядається як окрема гіпотеза, що підлягає перевірці в подальшому аналізі на усіх етапах побудови моделі. Основна мета моделей взаємозв'язку - виявити і кількісно виміряти вплив факторів на результат. Очевидно, щоб визначити ефект впливу і-го фактора, необхідно елімінувати (усунути) вплив інших факторів, умовно зафіксувавши їх шляхом відповідних розрахунків на одному і тому ж рівні.
На етапі модельної специфікації враховується характер зв'язку та особливості наявної інформації. За своїм характером зв'язки поділяються на стохастичні, різновидом яких є кореляційні зв'язки, та жорстко детерміновані (функціональні). Перші відображують стохастичний характер причинно-наслідкових відношень, Другі - адитивні чи мультиплікативні зв'язки між елементами розрахункових формул показників. Відповідно вибирається функціональна форма моделі: кореляційні зв'язки описуються переважно регресійними моделями, функціональні - балансовими або індексними. У моделях, що описують функціональні зв'язки, ступінь вільності при формуванні ознакової множини обмежена, маневрувати можна лише кількістю факторів, укрупнюючи їх чи деталізуючи. Для регресійних моделей характерна багатоваріантність як ознакової множини, так і функціональної форми моделі. Інформаційна база моделі залежить від того, як представлено об’єкт моделювання. Якщо він розглядається як сукупність елементів у просторі, то інформація подається просторовими рядами
У вигляді матриці обсягом
, де п - обсяг сукупності, т - кількість включених у модель факторів. Класична регресія передбачає однорідність сукупності, тобто всі одиниці сукупності мають бути однотипними щодо комплексу умов існування, а властиві їм закономірності однаковими для усіх одиниць без винятку. Якщо сукупність внутрішньо диференційована, має у своєму складі певні групи (класи) одиниць зі специфічним характером зв'язку, в моделі слід врахувати неоднорідність за принципом структурної подібності. Методи відображення неоднорідності залежать від характеру та сталості міжгрупових розбіжностей.Моделі, побудовані у просторовій площині, охоплюють одиничний, фіксований інтервал часу. Серія такого типу моделей за певний період дає можливість простежити динаміку взаємозв'язків, оцінити зміну потужності впливу окремих факторів, його перерозподіл.
Якщо об'єкт моделювання розглядається як первинний, неподільний елемент (галузь економіки, регіон, країна), то інформаційна база представляється багатовимірним динамічним рядом у вигляді матриці обсягом (т • Т), де Т- довжина динамічного ряду. В такому разі в моделі необхідно відобразити властиві процесу закономірності динаміки, як-от: тенденції, коливання, запізнення впливу тощо. За умови, що об'єкт моделювання нечисленний, а довжина динамічного ряду обмежена, просторові та динамічні ряди об'єднуються.
На практиці використовують переважно автономно побудовані моделі, тобто моделі одного показника-функції. Специфікація моделі залежить від її призначення, природи і структури взаємозв'язків, специфіки об'єкта моделювання, наявної інформації. Поєднання, комбінація усіх цих елементів визначає безліч типів моделей.
В автономних регресійних моделях (одного рівняння) відбувається складний процес елімінування впливів між включеними в модель факторами і виокремлення безпосереднього впливу кожного з них на результат. Фактичне використання такої моделі передбачає, що в разі необхідності рівні факторів можна змінювати незалежно один від одного. Проте в реальних умовах зміна одного фактора не може відбуватися за незмінності інших, вона спричиняє ланцюгову реакцію в усій системі взаємозв'язаних показників. Поряд з безпосереднім прямим впливом має місце опосередкований вплив, часом за різними напрямами, що потребує оцінювання сумарного впливу. Іноді одна й та сама змінна виступає водночас причиною і наслідком. Тоді виникає необхідність одночасного оцінювання прямого і зворотного впливів.
Складне переплетення взаємозв'язків соціально-економічних явищ потребує і складних інструментів аналізу. З-поміж таких інструментів є системи рівнянь, заміна множин висококорельованих ознак інтегральними факторами (головними компонентами) тощо. Методологічні засади модельної специфікації розглядаються за принципом «від простого до складного».
Регресійна модель описує об'єктивно існуючі між явищами кореляційні зв'язки. За своїм характером кореляційні зв'язки надзвичайно складні та різноманітні. В одних випадках результат у зі зміною фактора х, зростає чи зменшується рівномірно, в інших — нерівномірно. Іноді зростання може змінитися зменшенням і навпаки. Простежити всі ці взаємозв'язки і встановити точний функціональний вид практично неможливо. А тому при виборі типу функції йдеться лише про апроксимацію відносно простими функціями незрівнянно більш складних за своєю природою взаємозв'язків. На практиці перевагу віддають моделям, які є лінійними або приводяться до лінійного виду шляхом перетворення змінних, наприклад логарифмуванням. Такий підхід, безперечно, містить у собі певну умовність, оскільки передбачає однаковий характер зв'язку з усіма факторами. Проте використання надто складних функцій неминуче веде до збільшення кількості параметрів, а отже, зменшує точність вимірювання та ускладнює інтерпретацію результатів.
При обґрунтуванні типу функції слід враховувати й той факт, що межі варіації корельованих ознак у конкретних умовах простору і часу, в конкретній сукупності значно вужчі за їх можливі значення, і в цих межах варіації навіть лінійна функція може задовільно апроксимувати зв'язок.
У лінійному щодо параметрів рівнянні регресії індивідуальне значення результативного показника
(де j — порядковий номер одиниці сукупності) записується так: ,де
— вільний член рівняння; економічного змісту, як правило, не має, лише окреслює область існування моделі; — коефіцієнт регресії; показує, як в середньому змінюється зі зміною на одиницю її шкали вимірювання за незмінності інших включених в модель факторів і за інших рівних умов; — залишкова величина.У регресійній моделі основне навантаження покладається на коефіцієнт регресії
, він розглядається як своєрідна міра «очищеного» впливу на у і називається ефектом впливу.Процедура оцінювання параметрів регресійної моделі ґрунтується на методі найменших квадратів (МНК). Оскільки алгоритми МНК описано в математико-статистичній літературі й реалізовано в комп'ютерних програмах, наведемо лише загальну схему розрахунку статистичних характеристик моделі, акцентуючи увагу на їх змістовній інтерпретації.
Первинна інформація представляється як матриця факторних ознак X розміром (п • т) і вектора результативної ознаки у розміром (п • 1). Задля зручності використання алгоритмів МНК матриця X розширюється за рахунок додатково введеної фіктивної змінної , вектор якої представлений одиницями. Параметри моделі — вектор
визначаються розв'язуванням системи нормальних рівнянь, яка записується так: