Вестник акушерской анестезиологии №3(5) Март 2018 Вестник Март_2018_01 | Page 14
Вестник акушерской анестезиологии 2018 №3(5)
Напротив, статистическую значимость эффекта исследователь контролировать не может. Он может
только задать уровень статистической значимости, число, начиная с которого он не будет принимать
гипотезу о нулевом эффекте. Статистическая значимость определяется как самим природным
феноменом, который исследуется, так и случайным раскладом набранной выборки. Таким образом,
статистическую значимость эффекта в виде числа (ошибки p) исследователь не задает, а получает в
ходе анализа своей выборки.
Статистические методы обработки данных исследования – это строгие математические
процедуры, но территория их компетенции заканчивается на получении конкретной величины
эффекта и вероятности его отличия от нуля (ошибки р). Дальше дело исследователя - сравнивать
полученные числа с заданными заранее клинически важным эффектом и уровнем статистической
значимости. И вот с этого момента начинаются сложности и искушения.
Например, если в протоколе исследования стоит порог значимого снижения осложнения 25%, а
по результатам исследования оно снизилось на 20%, кроме того уровень статистической значимости
был задан 0,05, а р получено 0,047. Как интерпретировать такие результаты? Доказывают ли они наше
предположение об эффективности препарата?
Как правило, здесь вступает в игру предпочтение или интуитивное целеполагание исследователя.
Если он считает препарат неэффективным, то он будет строго следовать протоколу и сделает вывод,
что эффективность не доказана. Если он имел опыт эффективного применения препарата или по
другим причинам считает его эффективным, то он закроет глаза на то, что получил меньший процент
и очень сомнительную статистическую значимость (формально она же меньше установленного порога
0,05), и сделает вывод, что исследование доказало эффективность.
Именно на эти грабли и наступили авторы исследования WOMAN.
Они формально (а скорее тенденциозно, заранее полагая, что ТХА снижает частоту
кровотечений) подошли к интерпретации своих результатов. Ошибка р=0,045, например, которую они
указывают (на самом деле она равна 0,046), строго говоря меньше уровня значимости 0,05, но если
указывать только 2 знака после запятой, то она превращается в p = 0,05 и нулевую гипотезу уже
отвергнуть формально нельзя. На эту неубедительность эффекта указывает и верхняя граница 95%ДИ
относительного риска летального исхода (0,996), при округлении до 2 знаков после запятой,
превращающаяся в 1,00. Кроме того, само значение ОР, равное 0,81, указывает на снижение частоты
лишь на 19%, что явно меньше, чем исходно заданное клинически значимое снижение в 25%. Авторы
в нескольких местах слегка отошли от строгого следования протоколу в пользу смягчения исходно
заданных порогов значимости (и клинической, и статистической) и в результате получили
неубедительные заключения об эффективности ТХА.
Похоже, что в этом исследовании они были нацелены не на тестирование препарата, а на
доказательство его эффек