Вестник акушерской анестезиологии №3(5) Март 2018 Вестник Март_2018_01 | Page 14

Вестник акушерской анестезиологии 2018 №3(5) Напротив, статистическую значимость эффекта исследователь контролировать не может. Он может только задать уровень статистической значимости, число, начиная с которого он не будет принимать гипотезу о нулевом эффекте. Статистическая значимость определяется как самим природным феноменом, который исследуется, так и случайным раскладом набранной выборки. Таким образом, статистическую значимость эффекта в виде числа (ошибки p) исследователь не задает, а получает в ходе анализа своей выборки. Статистические методы обработки данных исследования – это строгие математические процедуры, но территория их компетенции заканчивается на получении конкретной величины эффекта и вероятности его отличия от нуля (ошибки р). Дальше дело исследователя - сравнивать полученные числа с заданными заранее клинически важным эффектом и уровнем статистической значимости. И вот с этого момента начинаются сложности и искушения. Например, если в протоколе исследования стоит порог значимого снижения осложнения 25%, а по результатам исследования оно снизилось на 20%, кроме того уровень статистической значимости был задан 0,05, а р получено 0,047. Как интерпретировать такие результаты? Доказывают ли они наше предположение об эффективности препарата? Как правило, здесь вступает в игру предпочтение или интуитивное целеполагание исследователя. Если он считает препарат неэффективным, то он будет строго следовать протоколу и сделает вывод, что эффективность не доказана. Если он имел опыт эффективного применения препарата или по другим причинам считает его эффективным, то он закроет глаза на то, что получил меньший процент и очень сомнительную статистическую значимость (формально она же меньше установленного порога 0,05), и сделает вывод, что исследование доказало эффективность. Именно на эти грабли и наступили авторы исследования WOMAN. Они формально (а скорее тенденциозно, заранее полагая, что ТХА снижает частоту кровотечений) подошли к интерпретации своих результатов. Ошибка р=0,045, например, которую они указывают (на самом деле она равна 0,046), строго говоря меньше уровня значимости 0,05, но если указывать только 2 знака после запятой, то она превращается в p = 0,05 и нулевую гипотезу уже отвергнуть формально нельзя. На эту неубедительность эффекта указывает и верхняя граница 95%ДИ относительного риска летального исхода (0,996), при округлении до 2 знаков после запятой, превращающаяся в 1,00. Кроме того, само значение ОР, равное 0,81, указывает на снижение частоты лишь на 19%, что явно меньше, чем исходно заданное клинически значимое снижение в 25%. Авторы в нескольких местах слегка отошли от строгого следования протоколу в пользу смягчения исходно заданных порогов значимости (и клинической, и статистической) и в результате получили неубедительные заключения об эффективности ТХА. Похоже, что в этом исследовании они были нацелены не на тестирование препарата, а на доказательство его эффек