Potenciar la utilidad de los métodos estadísticos
Apéndice
El método de bootstrap para derivar
intervalos y niveles de confianza
Hay 110 registros en los datos sobre la rotación de personal. El método bootstrap utiliza remuestreo con reemplazo; esto significa que elegimos uno de estos registros al azar, luego lo reemplazamos, por lo que
estamos empezando de nuevo con la muestra original, y luego elegimos
otro al azar, y así sucesivamente hasta que tengamos un remuestreo de
110. Todos los registros en el remuestreo provienen de la muestra, pero
algunos registros en la muestra pueden aparecer varias veces en el remuestreo, y otros en ningún momento. Sucesivamente repetimos este
procedimiento varias veces para generar múltiples remuestras.
Ahora, imaginemos que la población de la que se extrae la muestra
real sigue el mismo patrón que la muestra. Esto significa que el 0.91 %
(1/110) de la población será como el primer registro de la muestra, el
0.91 % igual que el segundo, y así sucesivamente. Esto a su vez significa
que, para tomar una muestra aleatoria de la población, queremos elegir
un registro como el primer miembro de la muestra con una probabilidad del 0.91 %, y de manera similar para la segunda, tercera, y así sucesivamente. Pero esto es exactamente lo que el remuestreo con reemplazo
logra, por lo que estas remuestras pueden considerarse muestras aleatorias de la población imaginaria. Esta no es la población real, pero parece razonable suponer que es similar, por lo que la variación entre las
remuestras da una buena idea del error de muestreo cuando se toma una
población real. En la práctica, la experiencia indica que el bootstrapping
generalmente ofrece resultados muy similares a los métodos convencionales. Más detalles y un vínculo al software utilizado para derivar los resultado