S(t) – оценка функции выживания,
n – общее число наблюдений (объем выборки),
j – порядковый (хронологический) номер отдельного события (наблюдения),
- индикатор цензурирования. Причем , если j-e событие означает отказ (смерть), и , если речь идет о потере наблюдения для дальнейшего исследования независимо от причин.
П - произведение по всем наблюдениям j, завершившимся к моменту времени t.
Так как приведенная оценка функции выживания состоит из произведения нескольких сомножителей, она также носит название мультипликативной (множительной).
Обратимся к тому же файлу исходных данных, который использовался для построения таблиц времен жизни. Оценки Каплана-Майера функции выживания, построенные по этим данным, показаны в следующей таблице:
Таблица 8
Результаты оценки функции выживания методом Каплана-Майера.
В первом столбце таблицы показаны номера наблюдений, для которых в соответствующий момент времени произошло некоторое событие. Знаком «+» обозначены цензурированные наблюдения (пациент был выписан).
Из таблицы видно, что вероятность того, что пациент проживёт больше 47 дней, равна 0,9097; вероятность того, что пациент проживёт больше 66 дней, равна 0,7161 и т.д.
Следует обратить внимание на стандартные ошибки полученных оценок. Стандартная ошибка функции выживания достаточно мала.
Сравним ошибками функции выживания (Cum. Prop Survivng), рассчитанной для таблиц времен жизни в табл.3).
Таблица 9
Стандартные ошибки функция выживания для таблиц времен жизни
Как мы видим, стандартные ошибки полученных оценок полностью не совпадают, прежде всего, это связано с тем, что в таблицах времён жизни данные были сгруппированы. В один интервал входит приблизительно 5 наблюдений, а в таблицах Каплана-Майера каждое наблюдение рассматривается в отдельности.
Ниже приведен график функции выживания.
Рис. 7. Функция выживания.
Для удобства интерпретации на графике полные наблюдения отмечены точками, неполные наблюдения - крестиками.
Преимущество метода Каплана-Майера, по сравнению с методом таблиц времен жизни, состоит в том, что получаемые оценки не зависят от разбиения времени жизни пациента (объекта) на интервалы, т.е. от группировки. Здесь нет необходимости разбивать временную ось на интервалы. Метод множительных оценок Каплана-Майера и метод таблиц времен жизни приводят практически к одинаковым результатам, если временные интервалы содержат максимум по одному наблюдению.
III. Сравнение выживаемости в группах
Представляет интерес сравнить времена жизни пациентов в различных группах, например, в группах мужчин и женщин. В системе «Statistica» предусмотрены специальные процедуры для сравнения выживаемости в группах.
Если имеется две группы, то используется опция Сравнение двух выборок (Comparing two samples).
Если количество групп больше двух, то используется опция Сравнение нескольких выборок (Comparing multiple samples).
Так как времена жизни не являются нормально распределенными, в этом случае приходится использовать непараметрические тесты, основанные на рангах. Имеется множество непараметрических критериев, которые могут быть применены для сравнения времен жизни, однако в подавляющем большинстве они неприменимы для цензурированных данных.
Для сравнения выживаемости в группах имеется несколько критериев (критерии для сравнения нескольких выборок представляют собой развитие соответствующих двухвыборочных):
- непараметричесий критерий Вилкоксона, предложенный для неполных наблюдений Геханом и Пето;
- F-критерий Кокса;
- логарифмический ранговый критерий (Lee, 1975 и 1980).
Эти критерии основаны на соответствующих z-значениях стандартного нормального распределения, которые могут быть использованы для статистической проверки различий между группами. В то же время надёжные результаты получаются лишь при достаточно больших объёмах выборок, в противном случае эти критерии не столь надёжны. Для иллюстрации адекватности построенной модели удобно применять параллельно визуальные методы.
Замечание. F-критерий Кокса обычно мощнее, чем критерий Вилкоксона-Гехана, если объёмы выборок (групп) меньше 50 (
). Это верно также в том случае, если выборки извлекаются из экспоненциального распределения или распределения Вейбулла.Сравним времена жизни пациентов, перенесших операции на сердце, в различных клиниках. Так как исходные данные содержат информацию о трех клиниках (Hillview, Biner и St. Andreas), выбираем опцию Сравнение нескольких выборок (Comparing multiple samples).
Графики позволяют наглядно убедиться в существовании различий между обозначенными группами (клиниками).
Рис. 8. Функции выживания для пациентов трех клиник.
Выводы:
Сразу можно отметить, что вероятность дожития пациентов, прооперированных в клинике BINER, значительно выше, чем в двух других клиниках на протяжении практически всего наблюдаемого периода времени.