Libro Medicina Basada en Evidencias MBE Alberto Narvaez | Page 168

LA LÓGICA DE LAS PRUEBAS DE SIGNIFICACIÓN ESTADÍSTICA Las pruebas o test estadísticos pueden parecer que han sido creados para dar dificultades. Sin embargo son de gran utilidad porque es la única forma de conocer si los resultados obtenidos en la muestra son similares a los que obtendría si se estudiaría a todo el universo o población de la que se extrajo la muestra. Lo anterior se conoce también como relevancia de los resultados, validez externa o capacidad de generalización estadística de un estudio. El término validez externa en Medicina Basada en Evidencia puede referirse también a la Utilidad práctica de los resultados, en caso de estudios de evaluación de eficacia de tratamiento se refiere a la evaluación de si el tratamiento o la intervención estudiada puede ser de utilidad para manejar nuestros propios pacientes (Millan, 2009). Imagine que en un estudio clínico controlado en el que se comparan dos tratamientos, se encontró que un tratamiento da mejores resultados que el otro. Pero como este resultado es de una muestra de pacientes, es necesario estimar si los resultados obtenidos en esta muestra se encontrarán también en el universo de pacientes de donde se obtuvo la muestra. Para lograr este propósito el primer paso es proponer, que la diferencia observada entre los tratamientos es debido solamente a un error de muestreo, es decir que no hay diferencias entre los dos tratamiento en el universo. Esto no es lo que se espera, con la lógica que se utiliza a menudo siempre se espera que un nuevo tratamiento sea superior al convencional. Sin embargo, cuando se hace análisis inferencial se inicia planteando lo contrario a lo esperado a lo que se denomina Hipótesis Nula (H0) y el resultado que se espera que suceda se denomina Hipótesis Alternativa o de trabajo (H1). Las pruebas estadísticas inferenciales indican la probabilidad (valor de p) de que, los resultados obtenidos en la muestra se deban al error muestral. Cuando este valor es pequeño, ejemplo p<0,01 se concluye que el resultado observado es improbable que suceda por error, lo que lleva a rechazar la propuesta de que no hay diferencias entre los tratamientos y por lo tanto a rechazar la hipótesis nula. Se puede concluir entonces que uno de los tratamientos es realmente mejor que el otro, o dicho de otra manera los resultados observados en el estudio (en el que se utilizó una muestra) también se dan en el universo del que se extrajo la muestra o que el resultado es significativo o confiable. El valor de p es una muy buena guía para analizar si los resultados observados pueden deberse al error muestral: valores pequeños de p, indican que los resultados son improbables que sucedan por error muestral. Sin embargo, es importante definir a que denominamos un valor de p pequeño. Existe una regla conveniente pero arbitraria: cuando el valor de p es menor de 0,05 (p<0,05) es decir 5%, se excluirá el error muestral como explicación. Cuando se tiene un valor de p menor al valor de referencia se puede decir que se ha alcanzado significación estadística. Sin embargo, el uso de esta regla arbitraria de p<0,05 no es una garantía. Supongamos que se realizan una gran cantidad de test estadísticos, puede aparecer un resultado estadístico espurio o incorrecto una vez en cada veinte pruebas. Esto se debe a que p=0,05 significa una probabilidad de uno en veinte de que ocurra un evento. Hay dos conclusiones de este análisis: 1. Los estudios en los cuales se han realizado múltiples test de significación darán regularmente significados espurios. 44