Libro Medicina Basada en Evidencias MBE Alberto Narvaez | Page 168
LA LÓGICA DE LAS PRUEBAS DE SIGNIFICACIÓN ESTADÍSTICA
Las pruebas o test estadísticos pueden parecer que han sido creados para dar
dificultades. Sin embargo son de gran utilidad porque es la única forma de conocer si los
resultados obtenidos en la muestra son similares a los que obtendría si se estudiaría a
todo el universo o población de la que se extrajo la muestra. Lo anterior se conoce
también como relevancia de los resultados, validez externa o capacidad de generalización
estadística de un estudio. El término validez externa en Medicina Basada en Evidencia
puede referirse también a la Utilidad práctica de los resultados, en caso de estudios de
evaluación de eficacia de tratamiento se refiere a la evaluación de si el tratamiento o la
intervención estudiada puede ser de utilidad para manejar nuestros propios pacientes
(Millan, 2009).
Imagine que en un estudio clínico controlado en el que se comparan dos tratamientos, se
encontró que un tratamiento da mejores resultados que el otro. Pero como este resultado
es de una muestra de pacientes, es necesario estimar si los resultados obtenidos en esta
muestra se encontrarán también en el universo de pacientes de donde se obtuvo la
muestra. Para lograr este propósito el primer paso es proponer, que la diferencia
observada entre los tratamientos es debido solamente a un error de muestreo, es decir
que no hay diferencias entre los dos tratamiento en el universo. Esto no es lo que se
espera, con la lógica que se utiliza a menudo siempre se espera que un nuevo tratamiento
sea superior al convencional. Sin embargo, cuando se hace análisis inferencial se inicia
planteando lo contrario a lo esperado a lo que se denomina Hipótesis Nula (H0) y el
resultado que se espera que suceda se denomina Hipótesis Alternativa o de trabajo (H1).
Las pruebas estadísticas inferenciales indican la probabilidad (valor de p) de que, los
resultados obtenidos en la muestra se deban al error muestral. Cuando este valor es
pequeño, ejemplo p<0,01 se concluye que el resultado observado es improbable que
suceda por error, lo que lleva a rechazar la propuesta de que no hay diferencias entre los
tratamientos y por lo tanto a rechazar la hipótesis nula. Se puede concluir entonces que
uno de los tratamientos es realmente mejor que el otro, o dicho de otra manera los
resultados observados en el estudio (en el que se utilizó una muestra) también se dan en
el universo del que se extrajo la muestra o que el resultado es significativo o confiable.
El valor de p es una muy buena guía para analizar si los resultados observados pueden
deberse al error muestral: valores pequeños de p, indican que los resultados son
improbables que sucedan por error muestral. Sin embargo, es importante definir a que
denominamos un valor de p pequeño. Existe una regla conveniente pero arbitraria:
cuando el valor de p es menor de 0,05 (p<0,05) es decir 5%, se excluirá el error muestral
como explicación. Cuando se tiene un valor de p menor al valor de referencia se puede
decir que se ha alcanzado significación estadística.
Sin embargo, el uso de esta regla arbitraria de p<0,05 no es una garantía. Supongamos
que se realizan una gran cantidad de test estadísticos, puede aparecer un resultado
estadístico espurio o incorrecto una vez en cada veinte pruebas. Esto se debe a que
p=0,05 significa una probabilidad de uno en veinte de que ocurra un evento. Hay dos
conclusiones de este análisis:
1. Los estudios en los cuales se han realizado múltiples test de significación darán
regularmente significados espurios.
44