Смекни!
smekni.com

Возможности анализа данных медико-биологических экспериментов в программе Statistica (стр. 3 из 3)

4. При промежуточном анализе данных, полученных в испытаниях тех или иных вмешательств [7].

Анализ времени жизни в ППО STATISTICA

Данные времени жизни имеют две характерные особенности, которые предопределяют специфику их анализа. Прежде всего возможна неполнота данных. Например, в клинических исследовании больные по тем или иным причинам «уходят» из-под наблюдения, часть лабораторных животных может регулярно забиваться для проведения анализов. Реальное же время жизни таких объектов больше длительности наблюдения за ними. Описанный феномен называется цензурированием справа. Наличие цензурированных данных затрудняет оценку эффекта изучаемого воздействия на время жизни, особенно при характеристике отдаленных результатов лечения. Другая особенность данных времени жизни - неадекватность распределения времени жизни статистической модели нормального закона распределения. Конкретный же вид распределения, как правило, неизвестен. Поэтому аппроксимация распределения времени жизни нормальному закону, явная или неявная (при использовании параметрических методов анализа), представляет угрозу для корректности статистических выводов [7,8,9,10].

Рис.5—Диалоговое окно в анализе исхода Каплана-Майера.

Как показано на рисунке 5, ППО STATISTICA запрашивает данные о цензурированности (необходим индикатор, указывающий на значение времени (даты) исхода).

Сравнение коэффициентов корреляции

Иногда исследователи сталкиваются с проблемой сравнения нескольких коэффициентов корреляции. Так, иногда различия между двумя коэффициентами кажутся очевидными, но при этом не являются статистически значимыми, что в первую очередь может быть обусловлено различием в численности выборок [6].

ППО STATISTICA позволяет автоматически сравнить 2 коэффициента корреляции в Difference test (рис. 6). Достаточными данными являются сами коэффициенты корреляции и численности групп.


Рис.6—Инструмент «Тест различий» в модуле основной статистики


Практическая часть

В эксперименте была изучена экспрессия CD25 (рецептор к интерлейкину 2) на CD4+ лимфоцитах больных рассеянным склерозом при пролиферативном ответе на МОГ (антиген миелина). Данные получены с помощью проточного цитофлуориметра.

Принята нулевая гипотеза: Процентное содержание пролиферирующих (делящихся) клеток не связано с процентным содержанием CD25-позитивных CD4+ лимфоцитов.

Статистическая обработка данных эксперимента проведена непараметрическими методами в ППО STATISTICA 8.0. В примере приведена вторичная обработка данных с целью показать необходимость последовательного анализа, включая проверку распределения на соответствие закону нормального распределения.

Рис. 7—Анализируемые данные

Рис. 8—Описательная статистика


Из таблицы, приведенной на рисунке 8, можно сделать предварительные вывод о несоответствии распределения данных з. Гаусса.

В качестве иллюстрации применен параметрический метод анализа связи.

Рис. 9—Коэффициенты корреляции при проведении анализа м.Пирсона и м.Спирмена.

Как показано на рисунке 9, коэффициенты корреляции при проведении анализа м.Пирсона и м.Спирмена не совпадают. По результатам анализа непараметрическим методом корреляции не выявлено, а по м. Пирсона выявлена сильная коррелятивная связь (R=0,83, р<0,05.). Рисунок 9 иллюстрирует распределение данных: одна точка является явно выпадающей.

После исключения выпадающей точки корреляция не выявлена (р>0,05), результат графически представлен на рисунке 11.


Рис. 11—Коэффициенты корреляции при проведении анализа м.Пирсона и м.Спирмена.

Как при анализе непараметрическим, так и параметрическим методом корреляции выявлено не было.

Таким образом, единственная выпадающая точка при параметрическом анализе данных с распределением, отличным от нормального, дает ложноположительный результат о наличии коррелятивной связи между параметрами.

Как показывает практика, модуль, позволяющий быстро и без дополнительных усилий осуществить проверку типа распределения данных, часто считается избыточным, и к анализу параметрическими методами приступают без доказательств правомочности такого анализа.


Заключение

Первая попытка обсудить вопросы, связанные со статистической вероятностью, в медицинской литературе была предпринята в 30-х годах XX века. На сегодняшний день в информационной среде, общепонятный и общепринятый язык статистического анализа становится одним из элементов доказательной медицины и биологии.

ППО STATISTICA является мощным инструментом для анализа результатов медико-биологических экспериментов любого уровня сложности, для создания многофакторных моделей и чувствительных тестов оценки эффективности, и только от исследователя зависит качество полученных результатов. Достаточная простота работы в ППО STATISTICA дает возможность самостоятельно анализировать результаты специалистам медико-биологического, а не математического профиля.

Неграмотная работа с данными приводит к грубым систематическим ошибкам, более того, может быть потеряна ценность самих экспериментальных данных при неправильной статистической обработке. Подбор метода остается за исследователем, как и планирование эксперимента с возможностью получения данных от репрезентативных выборок.

Использование ППОSTATISTICA сводит к минимуму случайные ошибки в расчётах, дает возможность выбора наиболее адекватного метода анализа и графического представления данных на всех этапах анализа, выявить выпадающие значения. Но ответ на вопрос, подвергать ли дополнительному анализу отдельные выпадающие наблюдения или исключить их, как ошибку измерения, остается за исследователем.

Использование пакетов статистических программ существенно экономит время, позволяя быстро проанализировать большие объемы информации. Последовательные версии ППОSTATISTICA (от 6.0 до 8.0) не претерпевают значительных изменений в модулях, необходимых для анализа результатов биологических экспериментов, что также экономит время, так как освоенными методами можно пользоваться в течение многих лет. В то же время, некоторые систематические ошибки анализа могут неоднократно вносить коррективу в результаты экспериментов. Поэтому, использование ППО STATISTICA не исключает необходимость знания исследователем статистических закономерностей.

Статистки основана на сложных математических моделях, и интерпретация результатов должна четко соответствовать закономерностям биологических систем или особенностям клинического использования результатов.


Литература

1. Гланц С. Медико-биологическая статистика.—«Практика», —

2. Москва. —1998.—495с.

3. Рокицкий П.Ф. Биологическая статистика. (Изд.' 3-е, испр.) —Минск, — «Вышэйш. школа», —1973. —320 с.

4. Боровиков В.П. Популярное введение в программу STATISTICA. Москва. —2005. —280с.

5. Боровиков В.П. STATISTICA: искусство анализа данных на компьютере – СПб, 2003. – 688с.

6. Куканков Г., Фигурин В. Методы обработки экспериментальных данных. — Минск, —2005. —122с.

7. Реброва О.Ю. Статистический анализ медицинских данных Применение пакета прикладных программ STATISTICA. —М., МедиаСфера, —2002. —312 с.

8. Юнкеров В.И., Григорьев С.Г. Математике-статистическая обработка данных медицинских исследований. —СПб. —ВМсдА, —2002 —266 с.

9. Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы. — М., —Издательство РАМН, —2000. —52 с.

10. Gore S.M., Jones G., Thompson S.G. The Lancet's statistical review process: areas for improvement by authors. —Lancet. —1992; —№ 340 —Р.100-102.

11. Lang. T. Twenty Statistical Errors Even You Can Find in Biomedical Research Articles. Croatian Medical Journal 2004 —№ 45(4), —Р.361-370