Supuestos iniciales
Para una adecuada interpretación de los efec-
tos resultantes en este modelo, se ha optado
por configurarlo a tenor de los siguientes
supuestos:
l Se ha optado por elaborar un modelo
jerárquico lineal calculado mediante el
paquete estadístico HLM 58 . Dada la
estructura de los datos y el modo de
recogerlos, mediante un muestreo bi-
etápico en el que en un primer
momento se seleccionaron centros
educativos y luego un grupo de alum-
nos dentro de cada centro, el modelo
jerárquico lineal parece especialmente
apropiado. Los alumnos de un mismo
centro tienen en común determinados
rasgos o características por el hecho de
estar escolarizados en el mismo centro y
el modelo tiene en cuenta esa depen-
dencia jerárquica de los datos. El proce-
dimiento de cálculo permite desagregar
la varianza de las variables en dos com-
ponentes: la común a los alumnos por el
hecho de estar escolarizados en un
mismo centro y el resto, atribuible a la
propia diversidad de los alumnos inde-
pendientemente de sus centros de
escolarización. Aunque es posible
poner a prueba si el efecto común varía
entre distintos centros, para simplifi-
car los cálculos y la interpretación sub-
siguiente se ha supuesto que tiene un
efecto uniforme a lo largo de todos
ellos.
l La variable dependiente es la puntua-
ción en lectura obtenida por los alum-
nos en la prueba. Pero como los alum-
nos no contestaron todos a las mismas
preguntas (habrían necesitado más de
siete horas para hacerlo) la puntuación
58
59
l
l
en lectura, calculada según la metodo-
logía TRI, no consiste en una sola pun-
tuación por alumno sino en cinco pun-
tuaciones plausibles 59 . En la explora-
ción de factores realizada en los dos
capítulos precedentes hemos tomado
la media de esas cinco puntuaciones
como la puntuación individual del
alumno en lectura. Pero dadas las faci-
lidades que ofrece el paquete HLM para
calcular los modelos de regresión
teniendo en cuenta todos los valores
plausibles, se ha hecho uso de ellas con
el fin de obtener un cálculo de los erro-
res típicos y de la significación estadís-
tica más ajustado y preciso.
Los factores considerados tienen una
representación estadística en forma de
variables categóricas o en forma de
variables continuas. Los valores de las
variables categóricas (o nominales)
han sido convertidos en variables indi-
cadoras (o dummy) dicotomizadas. Por
ejemplo, la variable número de cursos
repetidos, de tres valores (0: no repitió
ningún curso; 1: repitió un curso; 2:
repitió dos cursos), ha sido convertida
en dos variables dicotómicas distintas:
repetición1 (con valor 1 si repitió un
curso y 0 en cualquier otro caso) y repe-
tición2 (valor 1: repitió dos cursos;
valor 0: no es el caso). El conjunto de
esas dos variables indicadoras permite
conocer el efecto de los tres valores
originales de la variable número de cur-
sos repetidos: no repitió ningún curso
[0,0]; repitió un curso [1,0]; repitió
dos cursos [0,1].
Los valores de las variables continuas
han sido centrados. Centrar una varia-
ble significa restar a cada uno de sus
“Hierarchical Lineal Models”, versión 5.04, de S. Raudenbusch, A. Bryk, Y. Cheong y R. Congdon.
La TRI (Teoría de Respuesta al Ítem, Item Reponse Theory, IRT en inglés) no calcula propiamente una puntuación para cada alumno sino una
distribución de probabilidad de su habilidad lectora y a partir de esa distribución se seleccionan determinados valores plausibles. El con-
sorcio técnico internacional de PISA eligió tomar cinco valores al azar a partir de la distribución individual de cada alumno para que hubie-
ra cierta variabilidad en los resultados y así poder controlar los errores de medición y de muestreo al calcular el error típico asociado.
[ 115 ]