Вестник акушерской анестезиологии 2018 № 3( 5)
Комментарий эксперта Тихова Галина Петровна- научный сотрудник, лаборатория клинической эпидемиологии, институт высоких биомедицинских технологий ФГБУ ВПО « Петрозаводский государственный университет »
Изучив статью австралийских авторов Geoffrey P. Dobson, Kenji Doma, Hayley L. Letson « Clinical relevance of a p-value: Does TXA save lives after trauma or post-partum hemorrhage?», а также отчет по мультицентровому испытанию WOMAN « Effect of early tranexamic acid administration on mortality, hysterectomy, and other morbidities in women with post-partum haemorrhage( WOMAN): an international, randomised, double-blind, placebo-controlled trial », который они критикуют, я полностью согласна с их аргументами и заключениями, единственное- я бы поточнее определила, в чем слабость интерпретации результатов, а также полагаю, что у авторов исследования проблемы были не только в интерпретации, но и в методологии расчете необходимого объема выборки для таких маленьких частот, т. е. бомба была заложена еще на старте, а также в строгости следования разработанному протоколу на протяжении всего периода сбора данных. Теперь конкретные тезисы. Начну с теоретических аспектов интерпретации:
1. Все результаты биомедицинских исследований, в том числе и параметры, отражающие величину эффекта, имеют 2 измерения значимости:
- статистическую значимость, которая показывает нам, действительно ли число, которое мы получили на нашей выборке, отличается от нуля( от нулевого эффекта) в природе или это просто случайность, обусловленная нашей конкретной выборкой, на которой мы изучаем эффект( т. е. наша уверенность в том, что какой-то эффект есть, ошибка p);
- клиническую значимость, которая говорит нам о силе, величине эффекта( во сколько раз или на сколько процентов снижается частота, например, летальных исходов от кровотечений при применении ТХА), иными словами, на много ли снижается в среднем частота при использовании ТХА, чтобы это снижение рассматривать как важный существенный эффект от применения препарата.
Следовательно, только ошибка р, какая бы маленькая она ни была, или только величина относительного риска( ОР) вместе с ее 95 % ДИ, какая бы большая и впечатляющая она ни была,- сами по себе, единолично, по отдельности, не могут ответить на вопрос о наличии эффекта в спланированном клиническом испытании( это не касается обсервационных клинических исследований, там другие соображения). В клинических испытаниях эти 2 позиции должны всегда рассматриваться вместе: сначала статистическая значимость и если она имеет место, то далее- клиническая значимость. Понятно, что с увеличением объема выборки мы можем обнаружить любой, сколь угодно малый, эффект с достаточной статистической значимостью, чтобы утверждать, что эффект есть. Но нужно ли ломать копья, набирать по 20-30 тысяч человек, чтобы обнаружить, что от применения препарата частота снизилась, например, с 1,5 % до 1,4 %? Такое снижение на выборке в 20 000 пациенток будет указывать на то, что у подавляющего большинства этот препарат не работает и есть только единицы счастливчиков, у которых он подействовал, а он ли подействовал? На самом деле при таком раскладе это большой вопрос. Возможно, там включились какие-то конфаундеры, которые не были замечены или зарегистрированы в ходе исследования.
Эти 2 составляющих значимости эффекта отличаются тем, как и когда они обретают конкретные значения. Величина эффекта, которая будет считаться достаточной для того, чтобы утверждать о наличии действия препарата – клиническая значимость – задается исследователем до начала сбора данных и входит в протокол исследования. После того, как начался сбор данных, ни эта величина, ни переменные, по которым она рассчитывается, не меняются ни при каких обстоятельствах. Это своего рода фундамент, на котором строится протокол исследования и в дальнейшем вся доказательная база.
Obstetric Anesthesia Digest 2018 № 3( 5)
13