Смекни!
smekni.com

Методи математичної статистики (стр. 1 из 2)

Методи математичної статистики

Теорія ймовірностей і математична статистика виникли в середині XVII століття в результаті розвитку суспільства і товарно-грошових відносин.

Свою роль у цьому процесі відіграли й азартні ігри, вони послужили простими моделями для виявлення закономірностей у появі випадкових подій. Крім того, розвиток математичної статистики був обумовлений необхідністю обробляти дані, які зібралися до того часу в області керування державою: демографії, охороні здоров'я, торгівлі й інших галузях господарської діяльності.

Можна перелічити досить довгий список імен великих учених, які додали свого внеску у розвиток математичної статистики: П. Ферма (1601–1665) і Б. Паскаль (1623–1662), Я. Бернуллі (1654–1705) і П. Лаплас (1749–1827), К. Гаусс (1777–1855) і С. Пуассон (1781–1840), Т. Байєс (1701–1761) та ін. Ці імена мають бути вже відомі читачам з назв часто застосовуваних статистичних процедур, тестів і розподілів.

Першим, хто вдало об'єднав методи антропології і соціальної статистики з досягненнями в області теорії ймовірностей і математичної статистики, був бельгійський статистик Л. Кетле (1796–1874).

З його робіт випливало, що задача статистики полягає не лише у збиранні і класифікації даних, а й у їхньому аналізі з метою відкриття закономірностей. Л. Кетле одним з перших показав, що випадковості, які спостерігаються в живій природі, внаслідок їхньої повторюваності виявляють певну тенденцію, яку можна описати мовою математики. Л. Кетле заклав і основи біометрії.

Створення ж математичного апарата цієї науки належить англійській школі статистиків XIX століття, на чолі якої стояли Ф. Гальтон і К. Пірсон. Розроблені Ф. Гальтоном (1822–1911) і К. Пірсоном (1857–1936) біометричні методи увійшли в золотий фонд математичної статистики.

Пірсон запровадив у біометрії такі поняття, як середнє квадратичне відхилення і варіацію, йому належить розробка методу моментів, критерію згоди

2, він увів термін «нормальний розподіл», який зараз загальноприйнятий у багатьох країнах. (Відомо ще багато варіантів назви цього розподілу, наприклад, лапласів розподіл, гауссів розподіл, розподіл Гаусса-Лапласа, розподіл Лапласа-Гаусса.

Як апроксимація до біноміального розподілу він розглядався Муавром ще в 1733 р., однак Муавр не вивчав його властивостей.) К. Пірсон удосконалив запропоновані Гальтоном методи кореляції і регресії. Термін «регресія» був введений Ф. Гальтоном у 1886 р. Гальтон встановив, що в середньому сини високих батьків мають не такий великий зріст, а сини батьків з невеликим зростом вище за своїх батьків. Це було інтерпретовано ним як «регресія до посередності». Помилки в міркуваннях Гальтона були роз'яснені пізніше, приміром, Браунлі.

Однак біологи не відразу оцінили переваги, які давало використання математичної статистики в природознавстві. Положення дещо змінилося на краще, коли була обґрунтована теорія малих виборок.

Піонером у цій області був учень Пірсона В. Госсет, який опублікував у журналі «Біометрика» свою статтю під псевдонімом Стьюдент (звідси – критерій Стьюдента). Вважається, що цінність роботи Стьюдента полягала не у значних числових змінах під час розрахунку тестової статистики. Багато вчених задовго до Стьюдента використовували співвідношення, яке тепер має його ім'я, але без урахування обсягу вибірок (числа ступенів свободи) і співвідносили отриманий результат з таблицями стандартного нормального розподілу (аналог критерію Стьюдента для нескінченного числа ступенів свободи), користуючись при цьому різними застереженнями під час інтерпретації результатів.

Цінність роботи Стьюдента полягає в усвідомленні того, що треба брати до уваги «капризи» малих вибірок, причому не тільки в тій задачі, з якої починав Стьюдент, але й у всіх подібних. Крім того, він розробив таблиці, які можна використовувати для визначення довірчих інтервалів і перевірки критеріїв значимості навіть на основі дуже малих вибірок, що дає можливість вирішення багатьох статистичних задач в області клінічних досліджень.

Подальший розвиток теорія малих вибірок одержала у працях Р. Фішера (1890–1962), основне місце в його роботі займали питання планування експерименту. Фішер запропонував у біометрії цілий ряд нових термінів і понять, розглянув фундаментальні принципи статистичних висновків, показав, що планування експериментів і обробка їхніх результатів – дві нерозривно пов'язані задачі статистики.

Не можна не відзначити той величезний внесок, що зробили в розвиток теорії ймовірностей і математичної статистики російські вчені: О.Я. Хінчін (1894–1959), О.І. Хотимський (1892–1939), Б.С. Ястремський (1877–1962), В.І. Романовський (1879–1954), А.А. Ляпунов (1911–1973), А.Н. Колмогоров та його школа і багато інших.

У сучасній статистичній науці існує розподіл на дві основні школи: найбільш численна класична школа – послідовники Фішера і його учнів, а також суб'єктивістська, чи байєсівська школа.

І хоча на рівні прикладної статистики результати, одержані в рамках цих різних наукових шкіл, досить добре погоджуються, з широкого кола теоретичних і філософських питань ці два напрямки часто розходяться, пропонуючи різні підходи до вирішення задач, у тому числі в області біометрії.

Стисло основну розбіжність у підходах можна було б охарактеризувати в такий спосіб: прихильники класичного підходу єдино можливою вважають частотну інтерпретацію імовірності (тому такий підхід називають ще «frequentist school»), суть їхнього підходу полягає в тому, що вони починають вирішення задачі з вибору моделі і перевіряють, чи може дана модель «пояснити» отримані (чи ще більш «екстремальні») дані. Відмінність байєсівського підходу полягає в тому, що до того, як будуть отримані дані, статистик розглядає ступінь своєї довіри до різних можливих моделей і представляє їх у вигляді ймовірностей (апріорні імовірності). Як тільки дані отримані, теорема Байєса дозволяє розрахувати нову множину ймовірностей, що являють собою переглянуті ступні довіри до можливих моделей на основі отриманих даних (апостеріорні імовірності). Оцінка апріорних ймовірностей є суб'єктивною, тому даний підхід і називається суб'єктивістським.

Зараз основні статистичні процедури і тести в області клінічних досліджень засновані на класичних підходах, хоча за необхідності допускається застосування байєсівських процедур. Байєсівський підхід стає все більш популярним в області фармакокінетики.

Можна сказати, що клінічні дослідження мають ще тривалішу історію, ніж математична статистика. Клінічні дослідження в тому розумінні, що ми звикли вкладати в це поняття, в основному одержали розвиток після другої світової війни, хоча відомі і більш ранні приклади. Вважається, що вже у працях середньовічного вченого, лікаря і філософа Ібн Сіни (Авіценна) (980–1037), чиї трактати в області теоретичної і клінічної медицини були надзвичайно популярні протягом багатьох століть і були обов'язковим керівництвом, містилися згадки про технологію проведення «клінічних досліджень».

А в книзі видатного вірменського лікаря і натураліста Амірдовлата Амасіаці (помер у 1496 р.) «Непотрібне для неуків» (переклад з вірменської і коментар канд. мед. наук С.А. Варданян, серія «Научное наследие», 1990), що є узагальненням тривалого історичного шляху розвитку вірменської медицини і природничих наук у XV столітті, містяться 7 основних умов, яких автор рекомендує дотримуватися під час проведення іспитів лік, що перегукуються з принципами, які лежать в основі сучасних клінічних досліджень. «І говорять, що природа лік пізнається дослідним шляхом. Перша умова полягає в тому, що застосовують випробувані ліки в чистому вигляді, без сторонніх домішок.

Друга умова полягає в тому, що коли випробовують одні ліки, треба давати їх людині з помірною натурою так, щоб видно було її дію на природу (поняття «помірна натура», відповідно до середньовічної теорії, сучасною медичною мовою означало б групу норми).

Третя умова полягає в тому, що одні ліки слід випробовувати при одній хворобі, а не при двох і більше захворюваннях. Оскільки вони корисні при одному захворюванні, а на друге не діють, людина не може зрозуміти, куди ж поділася їхня корисна дія.

Четверта умова полягає в тому, що коли ліки виявляються корисним при декількох хворобах, то слід перевірити, чи є ця дія чимось, властивим тільки їм, чи вона залежить від інших сторонніх обставин.

П'ята умова полягає в тому, щоб сила ліків відповідала силі хвороби.

Шоста умова – щоб враховувати пору року, оскільки існує така пора, коли ліки діють, і така, коли вони не діють або виявляють слабку дію. Сьома умова полягає в тому, щоб при введенні цих лік дія їх була б постійною, оскільки якщо вони то діють, то не діють, то це залежить не від ліків, а від сторонніх причин».

Можна сказати, що автор цих правил розумів необхідність правильної постановки і дотримання умов експерименту, а також важливість грамотної інтерпретації отриманих у дослідженні результатів.

Сьогодні вже неможливо уявити собі клінічні дослідження без статистичної обробки отриманих результатів. Вперше рандомізовані клінічні дослідження в сучасному розумінні були проведені в Англії, а одним з основних виконавців був відомий статистик Остін Б. Хілл (1897–1991).

Нині статистична наука продовжує розвиватися. Так, у 90-і роки XX століття була зроблена величезна методологічна робота, яка має безпосереднє відношення до статистичного аналізу клінічних досліджень. Цікаві роботи вчених-статистиків у цій області стосувалися питань метааналізу, перехресного дизайну, досліджень біоеквівалентності, послідовного дизайну вимірювань, що повторюються, тощо.

Досить важко дати вичерпне визначення статистики як дисципліни. Найбільш вдалим можна вважати таке визначення: «наука, що вивчає методи збирання й інтерпретації числових даних».

Таким чином, головна мета статистики – одержання осмислених висновків з неузгоджених (що підлягають розкиду) даних. Оскільки індивідуумам властива уроджена мінливість ознак (наприклад, ріст, маса тіла тощо) і, крім того, біологічні ознаки можуть випадково змінюватися в часі, природа клінічних даних, що характеризуються розкидом чи варіацією, диктує необхідність їхнього статистичного оцінювання.