Смекни!
smekni.com

Однофакторний і двофакторний дисперсійний аналіз (стр. 1 из 2)

Реферат

з дисципліни

“Теорія ймовірностей та математична статистика”

на тему: „Однофакторний і двофакторний дисперсійний аналіз”

2006

Зміст

Вступ

1. Загальні відомості про дисперсійний аналіз

2. Однофакторний дисперсійний аналіз

3. Двофакторний дисперсійний аналіз

Висновки

Список використаної літератури

Вступ

Важко установити, хто вперше порушив питання, нехай і в недосконалій формі, про можливість кількісного виміру можливості появи випадкової події. Ясно тільки, що більш-менш задовільну відповідь на це питання зажадав великого часу і значних зусиль видатних дослідників цілого ряду поколінь.

345 років тому, у 1657 році, був опублікований твір видатного голландського вченого Християна Гюйгенса "Про розрахунки при грі в кості", що є одним з перших досліджень в області теорії ймовірностей.

Звичайно вважають, що теорія ймовірностей виникла в середині XVII сторіччя, причому її появу зв'язують з іменами П. Ферма (1601-1665), Б. Паскаля (1623-1662) і Х. Гюйгенса (1629-1695). У роботах цих вчених у зародковому виді фігурували поняття ймовірності випадкової події і математичного чекання випадкової величини. Відправним пунктом досліджень були задачі, зв'язані з азартними іграми, особливо іграми в кості, оскільки при їхньому вивченні можна обмежуватися простими і зрозумілими математичними моделями. Однак учені розуміли важливість нових понять, наприклад, Гюйгенс у творі "Про розрахунки при грі в кісті" писав: "...думаю, при уважному вивченні предмета читач помітить, що має справу не тільки з грою, але що тут закладаються основи дуже цікавої і глибокої теорії".

Всі процеси, що відбуваються у природі чи людському суспільстві, є наслідком взаємодії багатьох факторів. Для того щоб вивчити ці процеси і надалі керувати ними, необхідно з'ясувати, яку роль у досліджуваному процесі відіграє кожний фактор окремо. Наприклад, у разі вивчення руху тіла слід з'ясувати, які сили спричинюють його рух, а які гальмують; яким чином саме рухоме тіло впливає на ті сили, що діють на нього. Досліджуючи процес зміни курсу деякої валюти, скажімо гривні, потрібно з'ясувати вплив багатьох економічних і соціальних факторів як внутрішніх, так і зовнішніх, що можуть істотно змінювати курс національної валюти щодо долара, німецької марки і т. ін.

Усі зазначені фактори необхідно подати з допомогою певних кількісних оцінок, а далі — скористатися відповідними математичними методами. Отже, щоб мати змогу застосувати математичні методи з метою вивчення взаємодії тих чи інших факторів, слід уміти виражати дію кожного з них кількісно.

Щоб дістати потрібні числові дані, необхідно провести серію спостережень. Отже, спостереження є найважливішою ланкою будь-якого експерименту. Слід, проте, враховувати, що жодний найретельніше підготовлений експеримент не дозволяє виокремити саме той фактор, який для нас головний. Адже в здійснюваному експерименті ми не в змозі вилучити численні зайві фактори, які нас не цікавлять. Так, вивчаючи падіння тіла, ми не уникнемо дії на нього сил, зумовлених обертанням Земної кулі. Коли ж ідеться про хімічні реакції, нам ніколи не доведеться стикатися з чистими елементами. А досліджуючи вплив на врожайність тієї чи іншої культури внесеного в ґрунт добрива, ми не можемо знехтувати впливом інших факторів (опади, середня весняна температура, економічний стан регіону і т. ін.), які безпосередньо впливають на остаточний наслідок експерименту — урожайність.

Отже, кожне спостереження дає нам лише наслідок взаємодії основного фактора. який нас цікавить, з багатьма сторонніми, другорядними. Деякі з них погрібне й можна враховувати-в дослідженнях. Врахування ж решти факторів або в принципі неможливе, або недоцільне з якихось міркувань. Тому за реальних умов під час дослідження будь-якого процесу застосовують метод його формалізації, беручи до уваги-інше ті фактори, які істотно впливають на зазначений процес.

Водночас усі ті фактори, якими експериментатор нехтує, загалом відбиваються на наслідках експерименту, надаючи їм неоднозначності.

Так настають непередбачені наперед події, котрі називають випадковими. Випадкові події в масі спостережень підпорядковані, як з’ясували дослідники, певним характерним лише для них невипадковим законам.

Математична наука, що вивчає закономірності масових подій називається теорією ймовірностей.

Науку, що використовує теорію ймовірностей для обробки численних одиниць інформації як наслідків експерименту, називають математичноюстатистикою.

Зауважимо, що нині існує тенденція до появи нових економічних дисциплін, таких як «Економетрія», «Теорія ризику», «Теорія надійності». «Інформатика» і т. ін., котрі тісно пов'язані з теорією ймовірностей. Своїм виникненням ці дисципліни завдячують саме теорії ймовірностей. Отже, теорію ймовірностей можна розглядати як об'єднання певної кількості різнорідних і доволі розвинених дисциплін, кожна з яких зокрема і всі вони разом мають стати науковим багажем кожного економічно освіченого спеціаліста.

Послідовність операцій, виконуваних з додержанням певного комплексу умов. називають експериментом (дослідом, спробою).Наслідок будь-якого експерименту називають подією.

Експеримент не обов'язково має виконувати людина. Він може здійснюватися незалежно від неї, скажімо комп'ютером. Людина в такому разі є спостерігачем, котрий фіксує наслідок експерименту— подію.

1. Загальні відомості про дисперсійний аналіз

Дисперсійний аналіз був створений спочатку для статистичної обробки агрономічних дослідів. В наш час його також використовують як в економічних експериментах, так і технічних, соціальних.

Сутність цього аналізу полягає в тому, що загальну дисперсію досліджуваної ознаки розділяють на окремі компоненти, які обумовлені впливом певних конкретних чинників. Істотність їх впливу на цю ознаку здійснюється методом дисперсійного аналізу.Відповідно до дисперсійного аналізу будь-який його результат можна подати у вигляді суми певної кількості компонент. Так, наприклад, якщо досліджується вплив певного чинника на результат експерименту, то модель, що описує структуру останнього, можна подати так:

де xij — значення ознаки X, одержане при i-му експерименті наj-му рівні фактора.

Під рівнем фактора розуміють певну його міру.

Наприклад, якщо фактором є добрива, які вносяться в землю з метою збільшення врожайності сільськогосподарської культури, то рівнем фактора в цьому разі є кількість добрива, що вноситься в грунт;

загальна середня величина ознаки X;

αj — ефект впливу фактора на значення ознаки Xна j-му рівні;

εij — випадкова компонента, що впливає на значення ознаки X в i-му експерименті на j-му рівні.

При цьому М(εij) = 0 і εij, як випадкові величини мають законрозподілу ймовірностей N(0;σ2) і між собою незалежні ij =0 ).

Складнішою моделлю аналізу є вивчення впливу на результати експерименту кількох факторів. Зокрема при аналізі впливудвох факторів структура моделі набуває такого вигляду:

,

де xijk – значення ознаки Х в i-му експерименті на j-му рівні впливу фактора A і на k-му рівні впливу фактора В;

загальна середня величина ознаки X; αi ефект впливу фактора А на i-му рівні, βj — ефект впливу фактора В на j-му рівні; γij ефект одночасного впливу факторів A і В; εijk — випадкова компонента.

У разі проведення дисперсійного аналізу досліджуваний масив даних, одержаних під час експерименту, поділяють на певнігрупи, які різняться дією на результати експерименту певних рівнів факторів.

Вважається, що досліджувана ознака має нормальний закон розподілу, а дисперсії в кожній окремій групі здобутих значень ознаки однакові. Ці припущення необхідно перевірити.

2. Однофакторний дисперсійний аналіз

Нехай потрібно дослідити вплив на ознаку Х певного одного фактора. Результати експерименту ділять на певне число груп, які відрізняються між собою ступенем дії фактора.

Для зручності в проведенні необхідних обчислень результати експерименту зводять в спеціальну таблицю:

Таблиця. 1

Відповідно до моделі однофакторного дисперсійного аналізу необхідно визначити дні дисперсії, а саме: міжгрупову (дисперсію групових середніх), зумовлену впливом досліджуваного фактора на ознаку X. і внутрішньо групову, зумовлену впливом інших випадкових факторів.

Загальна дисперсія розглядається як сума квадратів відхилень:

.

Тоді поділ загальної дисперсії на компоненти здійснюється так:

Для того щоб мати виправлені дисперсії, необхідно кожну зі здобутих сум поділити на число ступенів свободи.

Так, для загальної дисперсії

виправлена дисперсія дорівнюватиме

Виправлена дисперсія S12, що характеризує розсіювання всередині групи, зумовлене впливом випадкових факторів, обчислюється за формулою: