3.- Muestras probabilísticas en la investigación social.

Como se indicó en la fundamentación del Axioma 1, hablar de muestra implica alguna forma de representación del universo a través de una parte tomada de él. Clásicamente, uno de los primeros problemas que debe resolverse cuando se ha decidido utilizar muestras, es, si se trabajará con muestras con probabilidad de error muestral conocido, es decir muestras probabilísticas, o muestras sin conocimiento de esa probabilidad de error muestral, las denominadas muestras no probabilísticas ((2)).

Las primeras gozan, en la investigación social, de un prestigio sobrevalorado pese que presentan dificultades habitualmente no resueltas, dificultades que, como hemos indicado, quedan en la zona oscura de la extrapolación simple de los enunciados de la estadística matemática o pura a los hechos sociales.

Veremos enseguida las dificultades que tiene el diseño de muestras probabilísticas en la conducta social, y cómo frecuentemente se toman ciertas licencias para su aplicación.

Para diseñar una muestra probabilística, es decir una muestra con probabilidad conocida de error muestral (diferencia entre el estadístico obtenido y el parámetro real en la población), se necesita cumplir cuatro requisitos:

3.a) Un esquema muestral completo y actualizado que permita numerar las unidades del universo; operacionalmente este esquema o marco muestral (un listado, un mapa), es el universo o población.

3.b) Un procedimiento de selección aleatorio, entendiéndose por tal uno que garantice una probabilidad conocida, igual e independiente para cada uno de los elementos que conforman la población o universo.

3.c) La fijación de una probabilidad de error muestral, denominada estadísticamente como nivel de significación o probabilidad de error a (alfa). Este valor es fijado por el investigador y en estudios sociales se emplean valores que oscilan entre el 1 y el 5%.

3.d) Una estimación de la heterogeneidad del universo, que en términos estadísticos es su varianza (o la raíz de la varianza, la desviación típica), cuando se trata de niveles de medición de intervalo y razón.

La varianza es un estadístico propio de un alto nivel de medición; sin embargo en la investigación social la mayoría de las variables son de bajo nivel, es decir son nominales u ordinales. En tales casos, para poder determinar la heterogeneidad de la variable se sustituye la varianza por la dicotomización de la "heterogeneidad" utilizando la distribución binomial; así una categoría relevante se convierte en "p", o probabilidad de éxito, y la otra, o las otras, se convierten en "q", teniendo como único requisito (Spiegel, 1978) el que N sea grande, de al menos 30 casos, y Np y Nq sean superiores a 5, para que haya aproximación a la curva normal (Véase nota final "5").

Para disminuir los costos del muestreo, se acepta un quinto factor para determinar el tamaño, un margen de error de estimación, una renuncia parcial a la precisión de las cifras estimadas.

Los dos primeros requisitos determinan la forma de seleccionar los casos, y los dos últimos determinan la adecuación del tamaño muestral, esto es el número de casos ( (3)).

3.1.- Dificultades para la muestra probabilística en estudios sociales

Las muestras son de tal naturaleza que si no cumplen cualquiera de los cuatro requisitos descritos, no son probabilísticas. Pero en los estudios sociales, de esos cuatro, sólo la fijación del nivel de significación resulta poco problemática, simplemente porque se determina a priori; su impacto tiene que ver más con el costo de trabajar con muestras de mayor o menor tamaño. Vemos, entonces, las dificultades de los tres restantes, respecto al esquema o marco muestral, el procedimiento de selección y la estimación de la varianza.

3.1.1.- El esquema muestral completo y actualizado

El esquema muestral completo y actualizado no siempre es posible de conseguir para estudios sociales. Cuando no se tiene el listado completo de personas, funcionarios de la empresa, hogares, tenemos una limitante. En estricto sentido, el uso de mapas donde se detallan manzanas y calles, sin una identificación precisa de las viviendas y/u hogares, por ejemplo, no permite cumplir el requisito de la probabilidad conocida de selección o igual e independiente para todos los casos (Robinson:1981); simplemente, no se sabe el tamaño exacto de la población (N); Aun con la realización habitual de algunos resguardos, sólo podemos suponer un buen nivel de aproximación.

Enseguida, vemos algunos ejemplos de muestreo donde se adopta decisiones que afectan en una magnitud desconocida el carácter aleatorio de la selección de las unidades, estos procedimientos son mucho más frecuentes que lo que parece en muestras donde no se dispone de un listado actualizado de los casos.

Nadie puede negar la importancia y calidad de la Encuesta CASEN en Chile ((4) ), sin embargo, para graficar la dificultad de este punto, en la CASEN III, 1994, se uso como información básica el Censo de 1982 (Schkolnik, 1995); para la CASEN IV, 1996, en cambio, se usó como esquema muestral el Censo 1992, y se actualizó en las 88 comunas con "crecimiento post-censal significativo de acuerdo a antecedentes proporcionados por el MINVU (Ministerio de la Vivienda y Urbanismo) (MIDEPLAN,1997); suponiendo con ello la adecuada actualidad de los datos del MINVU, sin embargo la actualización final, el empadronamiento en los sectores urbanos, se "limitó a un recorrido "exterior" del sector seleccionado" (Ibid, p.19). Tenemos, entonces, en el primer caso 12 años de rezago en con respecto al censo, en el segundo caso, tenemos 4 años, información que se procura actualizar con los datos del Ministerio, pero que como a la vez no ofrece suficientes garantías, se actualiza finalmente a ojo.

El segundo ejemplo: para un estudio de opinión de jóvenes de Valparaíso en 1992 (FLACSO,1992), se empleó como muestra base una muestra "confeccionada en 1987, por un equipo de FLACSO para una encuesta de opinión pública en las ciudades de Viña del Mar y Valparaíso...El procedimiento utilizado para actualizar la muestra consistió en dar instrucciones específicas a los encuestadores para los casos en que se encontraran en terreno con cambios significativos. En efecto se empadronaron las manzanas inmediatamente contiguas, siempre y cuando cumplieran con las mismas características socioeconómicas de la original" (Ibid, p.3), no se indica cuales fueron las instrucciones especificas para discriminar cambios "significativos" de los "no significativos", ni los indicadores para dictaminar "cumplimiento de las mismas características socioeconómicas". En el trabajo no se señala, tampoco, ningún indicador respecto a la congruencia de la muestra final usada con la muestra tomada como referencia que se diseñó 5 años antes y para estudiar otras variables.

Estas limitantes no son muy distintas en otros estudios basados en muestras de áreas. En las consultas periódicas, mas conocidas por su figuración en la prensa de actualidad, utilizando la misma muestra, no resuelve el punto, se cumple la afirmación de von Foester, no puede verse que no se ve lo que no se ve.

Corroborando la idea de la dificultad respecto de la aleatoriedad del muestreo de áreas, que corresponde a una de las aplicaciones más usadas del muestreo de clusters o conglomerados en los estudios sociales, Blua y Cavallini (CEPAL,1977:10) afirman: "Para tamaños muestrales iguales los estimadores del muestreo por conglomerados son en la mayoría de los casos menos eficientes que los estimadores de la msa (muestra simple aleatoria). Esto se debe a que las unidades elementales dentro de los conglomerados tienden a parecerse más entre sí, con respecto a la variable en estudio, que con el conjunto de unidades que forman la población completa. Los principales efectos positivos del uso de conglomerados son el que permiten bajar los costos y el tiempo empleado en viajes, se pueden identificar mejor las unidades elementales, y a veces se pueden reducir los errores no muestrales debido a que se logra ejercer una inspección y un control más riguroso".

No agregaremos las distorsiones derivadas de los casos de rechazo, aun manteniendo un número adicional de casos para sustituir.

3.1.2.- La estimación de la varianza

El problema mayor que tiene el diseño probabilístico deriva de la estimación de la varianza o heterogeneidad del universo. Con relación a la estimación de la varianza surgen dos dificultades relacionadas con los axiomas formulados. Como señala el Axioma 1, necesitamos conocer el universo para poder estudiarlo a través de muestras, y ese conocimiento esta vinculado con las variables que distinguimos en él (Axioma 2), incluyendo la o las delimitantes.

Aquí hay dos problemas, no uno, como se da por supuesto en la bibliografía: cómo estimamos la varianza, y qué varianza estimamos.

Esto implica que, para diseñar cualquier muestra, incluyendo una probabilística necesitamos tener una medición anterior del universo (axioma 1), pues bien esa estimación de la heterogeneidad o varianza tiene que estar disponible para determinar el tamaño de la muestra que necesitamos. Pregunta: ┐cómo se obtuvo ese dato?: en algunos casos mediante un censo, una investigación anterior. Si la determinación o estimación del parámetro necesitado se obtuvo, está resuelto parte del problema. ┐Y si la investigación anterior no usó muestra probabilística?, si fue así, implica que es un dato sesgado, con margen de error desconocido. ┐Podemos con un parámetro sesgado y con sesgo desconocido asegurar que nuestra determinación del tamaño es estadísticamente válida?. Mientras, revisemos como lo resuelve uno de los escasos autores que intenta profundizar en el tema.

Cochran (1971, p.112-113) señala: "en la práctica hay 4 formas de estimar la varianza de la población para la determinación del tamaño de la muestra: (1║) tomando la muestra en dos pasos, el primero a través de una muestra simple aleatoria de tamaño n, de la cual se obtienen los valores de S2 o P y el valor de n requerido, (2║) a través de los resultados de una encuesta piloto; (3║) por muestreo previo de la misma población o de una similar: y (4║) por conjetura sobre la estructura de la población, secundada por algunos resultados matemáticos". La dificultad está en que para la primera forma, la muestra simple aleatoria se necesita cumplir los cuatro requisitos indicados, e igualmente, las tres formas restantes son no-probabilísticas; además que en ninguna parte explica como hacer la "conjetura estructural" secundada por qué "resultados matemáticos" que sugiere para la cuarta forma ( (5)).

Si no hay investigación anterior que ofrezca la estimación del parámetro, simplemente no hay muestra probabilística.

Pero aquí no terminan las dificultades, viene la segunda, justamente la menos mencionada. La homogeneidad del universo, no es una propiedad "dura" o evidente, depende de la variable que se considere, por lo tanto cuando hablamos de la varianza que necesitamos para estimar el tamaño de la muestra probabilística, tenemos que precisar varianza de cuál variable. Y, como en la conducta social normalmente son muchas - a diferencia del control de calidad de las tuercas en las plantas industriales donde puede importar solo su diámetro, o en el estudio de la aceleración de partículas en el laboratorio de física, donde sólo importa su masa y velocidad, por ejemplo - tenemos que (axioma 2) el universo tiene tantas varianzas como variables tomemos en cuenta en él.

Si tomamos cualquier fórmula de determinación del tamaño muestral veremos que en todos los casos se considera una medida de la heterogeneidad, normalmente s( (6) ) (sigma, es decir la desviación estándar de una distribución muestral de medias ) (Spiegel, 1978;Galtung, 1966; Padua,1982; Blalock, 1994; Naciones Unidas; Manual de Encuestas sobre Hogares,1964; Emory, 1980; Conway, 1967; Yates, 1960; Kish, 1965), es decir la heterogeneidad del universo respecto a una sola variable.

El que matemáticamente sea imposible incorporar una segunda o más varianzas no obvía la dificultad. El problema que esto representa, es que la muestra probabilística que resulta es probabilística y "representativa" sólo con relación a esa variable y no a las otras

Repasemos esto último: aquí estamos de frente a uno de los puntos más críticos. Como se deduce del Axioma 2, el universo o población tiene tantas variables como se determine estudiar en él, y cada variable tiene su propia distribución, su propia varianza, y, como hemos dicho, en los estudios sobre o en poblaciones humanas, prácticamente nunca se estudia una sola variable.

┐Es posible denominar probabilística a una muestra que sólo lo es con relación a una de las variables que se estudia y que no lo es respecto de las otras?. La respuesta es no, aunque se haga así hasta la saciedad: las muestras probabilísticas, sólo son probabilísticas respecto a la variable que se uso para estimar la heterogeneidad del universo, y no lo son respecto de las otras variables. Cuando alguien dice que uso una muestra con un margen de error (muestral) de x%, debemos entender que una de las variables que estudió gozó, según su declaración, del privilegio de contar con muestra probabilística.

┐Puede la varianza de una sola variable asegurar el carácter probabilístico de las mediciones o estimaciones que se hagan de las otras o con las otras variables?. La respuesta es no, salvo que se elija para hacer la estimación aquella variable con varianza conocida que tenga el valor absoluto en dígitos significativos más alto. Es decir aquella variable del total de variables en estudio, que posee una varianza tal que arroja el mayor tamaño muestral.

Por ejemplo, la varianza del nivel de ingresos es $7.500, en cambio la del número de hijos nacidos vivos por mujer en edad fértil es 4,3; pues, si usamos el número 7500 en vez de 4,3 (o la raíz, es decir s), haremos que nuestra muestra sea probabilística para el ingreso, y de paso cubra la probabilidad de la segunda variable, aunque aumentando significativamente el n muestral. Esto obligaría a tener una estimación aceptable de las varianzas de todas las variables que se incluirán en el estudio, o al menos de las más relevantes. No sólo haría mucho más difícil, sino también mucho mayores los costos del muestreo.

Si, como se indicó, no es posible incorporar matemáticamente más de una varianza en la determinación del tamaño ┐Cómo puede elegirse la única variable que se considerará para el diseño probabilístico?. Veamos algunos casos de como se ha resuelto esto, cómo se han elegido dichas variables.

La bibliografía teórica y técnica sobre muestreo no tiene una respuesta; como afirmamos en la presentación de este trabajo la omisión de estas dificultades que son propias de la especificidad del estudio de la conducta social, es casi generalizada en la literatura metodológica y estadística para la Educación, la Sociología, la Psicología y las ciencias sociales en general.

Una de las pocas referencias encontradas aparece en Cochran (1971, p.107-108): "Usualmente es medida más de una característica en una encuesta por muestreo: algunas veces el número de características es grande. Si se especifica el grado de precisión deseado para cada característica, los cálculos llevan a una serie de valores conflictivos de n,. uno para cada característica. Se debe encontrar algún método para reconciliar estos valores", el autor no sólo no sugiere ninguno, sino que no vuelve a referirse el punto.

En los trabajos empíricos la situación se corrobora. En las encuestas de opinión y sondeos electorales se entrega muy poca información sobre el diseño muestral utilizado, en algunos casos en que se acompaña una ficha técnica se indica las ciudades o regiones incluidas, se insiste en que se trata de muestra probabilística y se afirma un margen de error de X%, representativa de un Y% de la población, sin precisar más .

Veamos algunos pocos casos donde es posible acceder a esta información.

Para la CASEN III se empleó "una muestra probabilística" y se estimó la varianza sobre la base de P, probabilidad binomial (donde s2 = Np(1-p)), sin especificar en modo alguno de qué variable se habla ni cuando se presenta la fórmula usada para determinar n, ni cuando "se realizó un análisis de la heterogeneidad de los universos que componían el total" (Schkolnik,1995). En la CASEN IV (MIDEPLAN, 1997) se afirma también la utilización de una muestra probabilística estratificada, por conglomerados y polietápica (p.12), más adelante se declara que "se procuró estimar el tamaño de la muestra, tratando de calcular varianzas.." sin especificar, tampoco, de qué variable se habla, y cuando se menciona una variable, en el acápite "18 Estimadores Propuestos para la CASEN (1996)", se afirma: "Para hacer más concreta la exposición, se ha tomado como ejemplo el calculo del ingreso medio estimado por vivienda" (p. 24). No hay en el texto otra especificación respecto de este punto.

Des Raj en su Teoría del Muestreo (1992), anuncia en las primeras páginas que, dadas la incertidumbre e imprecisión de otras formas de muestreo. "a partir de este momento, en este libro sólo tendremos en cuenta procedimientos de muestreo probabilísticos..", y en toda su exposición las variables serán tratadas como "y" o "x", sin hacer ninguna indicación respecto de cómo debe determinarse cual será la variable "y" o "x" ( (7) ) . En el Manual de Encuestas sobre Hogares de las Naciones Unidas (1964), sin intentar alguna fundamentación teórica, propone - a través de un ejemplo - como variable para la estimación del tamaño muestral, el tamaño medio de los hogares. Se agrega como único argumento que justifique dicha elección el que en "la mayoría de los países se conoce el tamaño medio del hogar", luego agrega menciones de encuestas a hogares en la antigua Rhodesia del Sur, y Suecia, donde por distintas razones no se utilizó el procedimiento estadístico que propone.

En un estudio de casos el Bureau Of Census (1968, p.4), realiza unas "consideraciones matemáticas del diseño de una muestra" y opta por una simplificación extrema, convirtiendo en discreta y binomial, p y q, la variable mas simple que encontró, por supuesto sin ninguna justificación teórica: "consideramos la estimación de una característica que posee alrededor de la mitad de la población; por ejemplo, el hecho de tener 12 años de edad o más", entonces se funciona con la p máxima 0,5 (ver nota final N║ 5).

Hasta aquí hemos visto las dificultades para trabajar con muestras probabilísticas en sentido estricto, aquellas que cumplan realmente los requisitos enunciados; hemos visto las dificultades para ello en el diseño muestral de la encuesta CASEN, por ejemplo; pero no hemos afirmado que los datos obtenidos en ese mismo estudio carezcan de representatividad y validez.

┐Cómo? ┐"Sin embargo se mueve"?; similar a un juego de cálculo silogístico, la consecuencia es verdadera aunque la premisa sea falsa. La explicación de esta aparente paradoja esta en las consecuencias de los cuatro principios del muestro con que iniciamos este escrito, y que se encuentran implícitos en el razonamiento que sustenta el muestro no-probabilístico.