2.- Los fundamentos del muestreo.

Todo el muestreo se basa en cuatro enunciados o principios: dos axiomas, un teorema y una ley:

2.2.a) - Axioma 1: Todo trabajo con muestras requiere un conocimiento previo del universo del cual se extraerán dichas muestras.

El tomar muestras se basa en la posibilidad de generalizar lo observado en una parte, hacia el todo; se basa en la idea de la similitud entre la composición de la muestra y el universo del cual se extrajo. Esto parece obvio, pero requiere un conocimiento anterior del universo. Si no se dispone de antecedentes que avalen ello, no podemos hablar de una muestra: para conocer algunas características de una población usando muestras. Necesitamos tener algunos conocimientos de dicha población en lo referente a la distribución de las características que nos importa estudiar. Esto, según Azorín y Crespo(1986, p.69), "el diseño óptimo de la muestra, en particular la determinación previa de su tamaño óptimo, sólo podría conseguirse a partir del conocimiento de la población. Esto es lo que algunos autores han llamado 'paradoja de Friedman".

Por ejemplo: nosotros sabemos que para conocer cómo los seres humanos asimilan el oxígeno en los tejidos de su cuerpo, nos basta con tomar una muestra con n = 1. Un observador que no fuese humano ni conociera a ninguno, no podría saber que con la muestra mínima basta.

Por lo tanto, muestra es un conjunto de eventos, casos o unidades que son tomadas o extraídas de una población, que de acuerdo a nuestro conocimiento de dicha población, posee algunas características similares al resto de conjunto del cual se extrae.

Esta distinción esta en la base de la propia identificación del universo. Y será un principio fundamental en todo diseño muestral posible.

2.2.b) Axioma 2: La similitud entre los componentes del universo no son propiedades dadas sino distinciones hechas por el observador.

La o las características presentes en los elementos de un universo que permiten identificarlo como tal y hacen posible el muestreo son elegidas por el investigador; a modo de ejemplo, desde el punto de vista de la identidad del yo, el universo de todos los seres humanos vivientes es absolutamente heterogéneo; en cambio, en cuanto a la asimilación celular del oxígeno, es absolutamente homogéneo. En el primer caso, la "muestra" sería la máxima posible ya que ningún elemento puede representar a otro; en el segundo caso, como vimos, con un elemento basta.

En el ejemplo indicado hay implícitas dos consecuencias; primero: hablamos de universo de acuerdo a la característica que definimos como observable en él. Así el universo de todos los seres humanos vivientes, no es el mismo que el de todos los seres humanos que hablan sólo español; el hecho de que uno puede ser subconjunto del otro puede ser relevante, sí, y sólo sí importa para el conocimiento que se busca alcanzar mediante el muestreo; cuando decimos la población de Chile, entendemos la suma total de los habitantes de Chile sólo por la fuerza del hábito, por omisión; pero en sentido estricto, Chile tiene tantas poblaciones como poblaciones se delimiten. En síntesis la propiedad de ser universo, no esta dada, es declarada por el investigador-observador.

Y, segundo, cualquier distinción de un universo requiere al menos una característica constante en todas las unidades que debe fijar el observador. Esta delimita, esto es, permite afirmar si un evento o elemento es o no parte del universo; hecha dicha distinción el observador fija nuevas características -las variables que estudiará- que se presentan en los elementos con diferente magnitud, cada una de estas características o variables tiene una distribución propia y distinta de las otras, es decir poseen una homogeneidad u heterogeneidad distinta, que estadísticamente se denomina varianza (o su raíz cuadrada, la desviación típica).

Ejemplo: El universo de los lectores del diario "X" (característica constante fijada para delimitar, en este caso sólo una) tiene elementos que varían poco en nivel socioeconómico, mucho en religiosidad, y mucho más en gustos musicales (para indicar sólo tres). Esto implica que el universo es perfectamente homogéneo con relación a la primera característica (la elegida para delimitar), y se hace cada vez más heterogéneo con cada una de las tres características, variables, siguientes. Por lo tanto el universo es homogéneo o heterogéneo según la característica el observador determine.

Además, aunque entre los lectores del diario X, exista la propiedad de creer o no en OVNIS, si el investigador no la considera, no es una característica del universo (no cumplirá ningún papel, aunque no se la niegue).

2.2. c)- Teorema del Límite Central

Una formulación de este (Daniel; 1985, p.108) ((1)):

"Sin tener en cuenta la forma funcional de la población de donde se extrae la muestra, la distribución de las medias muestrales, calculadas con muestras de tamaño n extraídas de una población con media m y varianza finita s2, se aproxima a una distribución normal con media m y varianza s2/ n, cuando n aumenta. Si n es grande, la distribución de medias muestrales puede aproximarse mucho a una distribución normal".

Con un ejemplo muy simple: si tomamos una muestra aleatoria de 20 habitantes de Valparaíso, y calculamos su promedio de edad, es mayor la probabilidad que el promedio así obtenido se acerque al promedio real de edad de los porteños, y viceversa, la probabilidad de que el promedio así obtenido se aleje del promedio real es más baja - si agregamos una segunda muestra, o tomamos una mas grande, aumentaremos la probabilidad de acierto.

2.2.d) La Ley de Los Grandes Números

En la formulación de Robinson (1981, p.16):

"Si un experimento es repetido más y más veces, entonces la frecuencia relativa del evento tiende a acercarse a la probabilidad del evento".

Mientras más veces se lance un dado más clara será la tendencia a que cada una de sus caras cumpla con aparecer 1/6 del total de lanzamientos.

De este modo la tendencia de muchas variables sociales de distribuirse de acuerdo a la curva normal como la edad, la inteligencia, la estatura, etc., se hace visible sólo a partir de grandes números de casos, a partir de 30 casos tomados al azar.

Estos cuatro enunciados o principios, como se ha indicado, fundamentan el muestreo, hacen posible conocer totalidades a partir de partes. Los mas conocidos - por ser justamente más "matemáticos" - son los dos últimos, el teorema y la ley; los dos primeros se manejan sólo tácitamente, salvo la única mención encontrada para este estudio, con relación al axioma 1, la referencia que hace Azorín a la 'paradoja de Friedman".