Los resultados del presente trabajo permiten comprobar empíricamente las supuestas ventajas teóricas de la técnica Likert de construcción de escalas frente a la técnica de Thurstone. El procedimiento utilizado permite la comparación de ambas técnicas, puesto que se partió de la misma muestra e idéntica base de items, que fueron seleccionados y puntuados conforme a las directrices características de ambos tipos de escalas.
Las ventajas más claras a favor de la técnica Likert se dieron en relación con la fiabilidad. El coeficiente a de la "escala Likert" alcanzó un valor de 0,910 mientras que el de la "escala Thurstone" fue de 0,749. Esta diferencia no se debe al número de items incluidos en cada escala, dado que fue el mismo en ambos casos; incluso al calcular a para la escala Likert utilizando sólo los 18 items comunes con la escala Thurstone se mantuvo la ventaja (a = 0,838). Cabría esperar que las diferencias entre ambas escalas se puedan deber a: 1) la forma de seleccionar los items, 2) el formato de respuesta (número de alternativas) y/o 3) el modo de asignar puntuaciones.
No parece probable que la mayor fiabilidad de la escala Likert se deba al mayor número de alternativas de respuesta. Confirmando lo apuntado por diversos autores (p.e. Chang, 1994) el coeficiente de fiabilidad de dicha escala varió en función del número de alternativas, sin embargo, aun con dos alternativas continuó siendo superior (a = 0,865) al de la escala Thurstone.
Las diferencias encontradas podrían deberse a los otros dos factores señalados. En lo que respecta a la forma de seleccionar los items, en las escalas Likert cuando se localizaron los items en un continuo según los principios de Thurstone se situaron en los extremos con un hueco en el medio (véase figura 5), cuestión que contrasta con los requisitos de Thurstone, donde los enunciados son localizados, más o menos, uniformemente en el continuo. Esta puede ser una de las causas de la mayor fiabilidad de la escala Likert, tal y como plantea Andrich (1989). Pero incluso eliminando las diferencias producidas por el método de selección de items y el número de alternativas (es decir, con los 18 items comunes las dos escalas), la fiabilidad de la escala Likert fue similar a la de Thurstone. Así pues, la asignación de puntuaciones según la metodología propuesta por Thurstone no parece aportar ninguna ventaja frente a una puntuación dicotómica de la escala Likert. Dada esta situación podría pensarse que los valores escalares asignados no son adecuados a consecuencia de la subjetividad de los juicios emitidos por los jueces; sin embargo esto quedaría descartado por el alto coeficiente de acuerdo inter-jueces encontrado (r = 0,981).
En relación con la validez utilizamos dos tipos de validación: de criterio y factorial. La validez de criterio fue superior para la escala Likert (r = 0,699, frente a r = 0,543 para Thurstone). En cuanto a la validez factorial no se alcanzaron resultados satisfactorios en ninguna de las escalas. Sin embargo en la escala Likert se consiguió optimizar la validez factorial (véase Figura 6 y Tablas I y II) sin un menoscabo significativo de la fiabilidad (a = 0,905 con 20 items).
En conclusión nuestros resultados parecen sugerir que uno de los mayores problemas de la técnica Thurstone está en la estrategia seguida para la selección de los items al intentar cubrir de manera uniforme todo el continuo de actitud. En los valores escalares medios cabrían tanto items realmente neutrales como items no directamente relacionados con la variable de actitud que se desea medir. Esto tendría consecuencias negativas en la fiabilidad y validez de la escala que, unidas a su mayor complejidad procedimental, parecen justificar la mayor popularidad de las escalas Likert.