4.- Muestras no-probabilísticas en la investigación social.

En la literatura se acostumbra a describir dos tipos de muestras (Padua, 1982; Blalock, 1994; Raj, 1992), las probabilísticas: al azar simple, estratificada, sistemática, y de conglomerados o clusters. Y las no probabilísticas: intencional, casual, y por cuotas.

Como hemos señalado el carácter probabilístico de una muestra depende directamente del cumplimiento de cada uno de los cuatro requisitos descritos en el acápite "2", por lo tanto estos "tipos" de muestras corresponden más propiamente a formas de selección de los casos.

De los tipos probabilísticos, el único que cumple estrictamente los requisitos descritos, es la muestra al azar simple, los otros corresponden a procedimientos que procuran acercarse a la selección aleatoria de las unidades, y justamente se emplean cuando un procedimiento aleatorio puro no es posible por falta de información o alto costo.

A modo de ejemplo, la muestra estratificada se justifica con la necesidad de asegurar la representatividad de una variable, en rigor una segunda variable que actúa como control. Esta estratificación además de suponer una estimación insesgada del peso de sus categorías en el universo, constituye una intervención no aleatoria por parte del investigador sobre la selección de los casos. No obstante, adicionalmente, si la varianza del la variable en base a la cual se estratifica determina un tamaño muestral menor que el que se establece con la primera variable, la primera asegura su representatividad; si fuese al revés, la variable para estratificar asegura a la primera; por lo tanto en ninguno de los dos casos - si efectivamente la selección de los casos fuese aleatoria - sería necesaria la estratificación.

Hasta aquí nos hemos encontramos con varias paradojas: las más usadas muestras probabilísticas se valen de procedimientos no aleatorios para seleccionar al azar sus unidades; para estimar la varianza que nos permita la adecuación de muestras probabilísticas podemos usar muestras no-probabilísticas; adecuamos el tamaño a la varianza de una sola variable sin embargo, denominamos probabilística a toda la muestra independientemente de la cantidad de variables que estudiemos.

La respuesta esta justamente en los cuatro principios del muestreo con que iniciamos este trabajo; y son ellos justamente los que directamente nos permiten fundamentar la validez no solo de la intromisión de estos procedimientos no estocásticos aceptados en los diseños muestrales denominados probabilísticos, sino también de la validez de los diseños no probabilísticos.

Así, procurando abreviar ya esta exposición, en la muestra intencional es el investigador el que en base a su conocimiento del universo selecciona aquellos casos que cumplen una o más condiciones que necesita: líderes de opinión, sujetos o informantes claves, vecinos según localidades, clientes, etc. Si el conocimiento que el investigador tiene del universo es adecuado (Axioma 1), si los casos reúnen las características que ha definido previamente (Axioma 2), si toma un número grande de casos (Ley), los resultados tendrán una mayor probabilidad de acercarse al parámetro que de alejarse (Teorema); y podrá legítimamente tomar decisiones con los resultados aunque los casos no hayan sido seleccionados al azar, aunque no este en condiciones de indicar cuanto error muestral o nivel de significación contienen sus datos, cumplirá todos los requisitos para generalizar los resultados.

De lo indicado podemos deducir que en los estudios sociales hay más simulación de trabajo con muestras probabilísticas, que trabajos que realmente se ajusten a lo que estadísticamente se denomina con propiedad así. Los niveles de significación con que habitualmente se presentan los datos procesados computacionalmente tienen muy poca validez((8)) .

Pasado el siglo XIX y cerrando ya las puertas del XX, el fantasma fisicalista del viejo Comte aun consigue hacernos olvidar que entre la conducta humana y las partículas atómicas hay más de una diferencia.