La polémica: tests sí, tests no
La polémica: tests sí, tests no
Texto:
http://www.psico.uniovi.es/REMA/v4n2/a1/p4.html
El abanico de campos de actuación y de fines cubiertos por los tests es
enorme. Sin embargo, a pesar de ser muy utilizados han sido también -o
quizás precisamente por eso- muy criticados. Muy pronto empieza a cambiar la
consideración social de los tests, enfriándose algo el entusiasmo inicial que
éstos habían suscitado; se comienza a escribir entonces el capítulo de
críticas a los tests, capítulo todavía sin terminar al día de hoy.
Desde la
década de los 20 y hasta la fecha, los tests han sido criticados con más o
menos virulencia y ferocidad, según las épocas, pero tanto las críticas como
el uso de los tests ha sido una constante. Por tanto, después de un período
inicial de uso acrítico y entusiasta de los tests, la tónica dominante ha
sido un uso continuado y generalizado pero crítico.
Quizás, si se comparan
las primeras décadas del siglo con esta última, el diagnóstico podría ser el
siguiente: a las puertas del cambio de milenio, se dispone de más tests y de
un mayor corpus teórico, pero se tiene menos confianza en ambos que a
comienzos de siglo o, al menos, una confianza menos ciega.
|
Las voces críticas se empiezan a escuchar a finales de la década de los 20;
en la década de los 40 la sociedad americana asiste ya a una versión
preliminar de la moderna controversia sobre el cociente intelectual, los
tests y la evaluación, que se desata con fuerza y alcanza su apogeo a
finales de la década de los 60 y durante toda la década siguiente (Cole,
1986; Cronbach, 1975). A partir de los 80, baja un poco la temperatura del
debate, pero el fuego todavía no se ha apagado.
Todos los tests estaban en el ojo del huracán pero, especialmente, los tests
de cociente intelectual y de inteligencia o aptitudes mentales en general
(Jensen, 1980). La realidad es que la evaluación psicológica realizada con
tests no ha sido cuestionada cuando ésta se ha efectuado con un objetivo
diagnóstico, habitualmente en el campo de la psicología clínica o de la
salud; la evaluación psicológica con tests ha sido criticada, sobre todo,
cuando los tests son utilizados en procesos de selección y, como no podía
ser de otra forma, las voces más airadas proceden -lógicamente- de los que
se quedan fuera en el proceso, de los que dejan fuera los tests en
situaciones de selección en el ámbito laboral o educativo (Graham y Lilly,
1984).
Una crítica muy general que se les ha hecho a los tests es que no son ni lo
suficientemente válidos ni lo suficientemente fiables como para justificar
su uso. Los detractores más radicales sostienen que, aun en el mejor de los
casos, los tests que realmente evalúan lo que pretenden lo hacen de una
forma bastante pobre y, por tanto, no resulta adecuada su utilización en
procesos de selección, orientación o distribución de recursos. Se cuestiona
a los tests por medir, en ocasiones, habilidades muy específicas, de alcance
muy limitado como para ser útiles para hacer predicciones significativas y a
largo plazo. Es incuestionable, además, que los tests de inteligencia no
miden muchas cosas que son importantes en la actuación posterior del sujeto
en el puesto laboral o educativo, lo que limita parcialmente su capacidad
predictiva (Wigdor y Garner, 1982).
Junto a estas críticas de carácter general, también se han cuestionado
aspectos más puntuales de los tests, como el contenido y formato de sus
ítems (especialmente, los de elección múltiple han sido objeto de frecuentes
polémicas), las normas utilizadas para la interpretación de sus puntuaciones
y la interpretación misma de las puntuaciones de los tests.
|
En ocasiones, los tests han tenido efectos secundarios en el proceso de
enseñanza-aprendizaje de los escolares. En efecto, muchos profesores, ante
las presiones sufridas dado el carácter obligatorio de la evaluación, se han
limitado a enseñar las habilidades que posteriormente iban a ser evaluadas,
pero es que, además, las han enseñado tal y como sugerían las
especificaciones de los tests utilizados en cada momento y de ningún otro
modo (teaching to the test), de manera que la instrucción se ha visto
focalizada en exceso y los alumnos con dificultades para generalizar (Popham,
1992).
Los estudiantes pueden dedicar gran parte de su tiempo a aprender cosas solo
porque éstas van a ser posteriormente preguntadas en los tests utilizados en
la evaluación y no porque tengan un valor intrínseco como objetivos
educativos. Los tests estandarizados están siendo cada vez más criticados
por fracasar en proporcionar objetivos instruccionales adecuados.
Los efectos no esperados de la evaluación, cuando no son deseables, pueden
ser seriamente perniciosos y distorsionar gravemente la esencia misma de la
propia evaluación. Por consiguiente, el uso masivo -o, cuando menos,
regular- de los tests en el ámbito educativo ha tenido de algún modo un
efecto perverso en el sistema educativo ya que, en ocasiones, el curriculum
se ha ido reorientando hacia los contenidos y habilidades evaluadas por los
tests estandarizados, en lugar de ajustarse éstos a los objetivos
curriculares definidos para los distintos cursos y ciclos educativos.
A los tests se les ha acusado también de ser herramientas al servicio del
poder, de ser instrumentos de control o represión social al servicio de la
clase económica y políticamente dominante, de constituir barreras para la
igualdad social y de oportunidades económicas, simplemente porque los tests
han servido para revelar diferencias entre grupos, y el tema de las
diferencias entre grupos es muy espinoso, levanta muchas ampollas.
Los tests han sido puestos en la picota porque ciertos grupos sociales
tienden a puntuar como grupo por debajo de la media de otros grupos
socialmente más favorecidos. Por ejemplo, los norteamericanos negros puntúan
como grupo una desviación típica por debajo del grupo de norteamericanos
blancos en tests de inteligencia, es decir, hay una diferencia de 15 puntos
en la escala de cociente intelectual entre la media de blancos y negros. Las
mujeres como grupo también tienden a puntuar por debajo de los hombres en
algunas pruebas de habilidad espacial y de razonamiento matemático, y por
encima de los hombres en pruebas de aptitud verbal.
El problema es que, durante bastante tiempo, las diferencias observadas en
los tests entre distintos grupos sociales, étnicos o raciales han sido
atribuidas a los tests, es decir, han sido explicadas aduciendo que los
tests estaban sesgados contra distintas minorías o grupos, favoreciendo
sistemáticamente a unos grupos en perjuicio de otros. Esto tiene una
repercusión social muy importante: el uso de los tests en procesos de
selección conduce a tasas distintas de selección en los distintos grupos. La
preocupación básica es dictaminar si los tests utilizados habitualmente en
el ámbito educativo y empresarial -y construidos, normalmente, por la clase
y raza económica y políticamente dominante- están sesgados contra grupos
minoritarios, es decir, si conducen a una discriminación en el acceso al
mercado laboral y educativo de personas pertenecientes a clases y razas ni
económica ni políticamente dominantes.
Las denuncias sobre la parcialidad de los tests crecen considerablemente a
finales de la década de los 60 y, sobre todo, durante los años 70, en parte,
debido al fuerte impulso que experimentó en esa época el movimiento por los
derechos humanos, que va a desatar un enorme interés y preocupación por el
posible uso y efecto discriminador de los tests.
Los tests pasan a disposición judicial y su adecuación en distintos
contextos de aplicación se va a dirimir en los juzgados. De hecho, en
algunos estados americanos se prohibió el uso de tests en la toma de
decisiones educativas, se fallaron sentencias judiciales importantes por
discriminación en la selección de personal y en la admisión a instituciones
educativas y se cometieron también no pocas tropelías desde el punto de
vista técnico. Una de las más conocidas es el caso Golden Rule. Tras ocho
años de litigios, el Educational Testing Service y la compañía de seguros
Golden Rule acordaron eliminar de las pruebas que utilizaban con sus agentes
de seguros aquellos elementos que eran respondidos correctamente un 15% más
en la población blanca que en la afroamericana. Esta decisión, políticamente
rentable, era técnicamente un disparate.
Para acabar de complicar las cosas, la polémica sobre los tests se vio
metida de lleno en el ya de por sí controvertido debate sobre la herencia y
el medio (véase, por ejemplo, Block y Dworkin, 1976; Jensen, 1969, 1980 y
Reynolds y Brown, 1984), cargando el acento más en el lado hereditario que
en el ambiental. Eran muchos -aunque no todos- los autores que sostenían que
las diferencias en las puntuaciones de los tests de distintos grupos
reflejaban diferencias hereditarias en habilidad, y que los tests de
inteligencia general medían características genéticas.
Así las cosas, es fácil entender porqué los tests eran considerados como
instrumentos claramente reaccionarios, ya que podían proporcionar un
fundamento a la desigualdad social (Gould, 1981), al estar ésta basada o
justificada por las diferencias en aptitud de distintos grupos.
Esta situación resulta, si no paradójica, sí cuando menos curiosa. En
efecto, los tests que fueron acogidos con gran entusiasmo por suponer un
paso adelante frente a posiciones retrógradas que utilizaban como criterios
para medrar la posición social, la familia o la cuna, pocas décadas después
son vilipendiados justamente por grupos o minorías socialmente
desfavorecidas. Como señala Cronbach (1975), lo llamativo es que los
impulsores de los tests pretendían abrir con ellos las puertas a personas
competentes pero socialmente más desfavorecidas e, irónicamente, el ataque
más feroz procede justamente de los que hablan en nombre de los pobres.
Lo cierto es que la preocupación por el tratamiento igualitario de grupos y
minorías, aunque totalmente legítima, condujo a una situación equívoca,
llevó a un planteamiento simplista y algo ingenuo conocido como la falacia
igualitarista.
Esta falacia arranca del supuesto de que todos los hombres son iguales, sin
distinción alguna de raza, color, sexo, religión, origen social o nacional.
Este supuesto es totalmente gratuito, ya que a nadie se le escapa la
diferencia que existe entre nacer en un país como España y, por ejemplo, en
Somalia; la diferencia es enorme no ya en las oportunidades sociales y
económicas sino simplemente en términos de mera supervivencia. Pues bien,
partiendo de este supuesto -falso- de que todos los hombres son iguales, se
plantea que si los tests hacen a los hombres desiguales es porque los tests
son injustos, ya que la justicia está obviamente con la igualdad de
oportunidades. Así, con esta argumentación, cualquier test en el que se
encontrasen diferencias entre grupos étnicos, culturales o socioeconómicos,
era considerado injusto y sesgado.
La realidad es que la falacia igualitarista llevó a confundir la legítima
igualdad de derechos y oportunidades con la (des)igualdad de los resultados
obtenidos. Esto condujo, irremisiblemente, a matar al mensajero -los tests-
cuando éstos lo único que hacían era constatar -que no producir- las
diferencias en la actuación media de distintos grupos. Los tests eran solo
el mensajero, no el enemigo: se confundían las diferencias entre grupos con
el sesgo y se trataba ingenuamente de buscar la igualdad en los resultados
como forma de remediar la desigualdad de oportunidades. Sin embargo, el
papel de los tests no es conjurar los demonios sociales del mundo sino ser
un reportero neutral de lo que en el mundo acontece.
Trasladado el problema a la arena política, su solución pasa por encontrar
un punto de equilibrio entre el principio de igualdad de oportunidades para
cada individuo de la sociedad con la realidad incontestable de una
procedencia y una formación desigual de dichos individuos.
Trasladado el problema a la arena técnica, el objetivo de los constructores
de tests y de los psicómetras debe centrarse en las diferencias entre grupos
que tienen su origen en los ítems del test, y no en el ambiente o la
procedencia de los individuos. Esos ítems son los que realmente pueden
sesgar o distorsionar la actuación de los sujetos en el test.
En suma, los tests han sido criticados o debatidos tanto dentro como fuera
del marco de la psicología, es decir, las críticas han trascendido el ámbito
de lo puramente psicométrico y los tests se han convertido en una cuestión
de debate público e incluso legal.
En ambos terrenos -público y profesional- las críticas a los tests tienen
que ver más con el uso inadecuado que a veces se hace de los tests que con
las propias características o propiedades técnicas de los mismos. Para
ilustrar este punto, Muñiz (1998) compara los tests con el automóvil,
considerado como el mayor homicida de nuestros días. Sin embargo, a pesar
del elevado número de muertes que ocasiona, son muy pocos los accidentes
atribuibles a fallos mecánicos, es el uso inapropiado que se hace del
automóvil lo que genera la elevada tasa de siniestralidad. Algo similar
ocurre con los tests: el problema no es tanto sus características técnicas
sino el uso que se hace de ellos. Y el mal uso de los tests puede provenir
de tres fuentes: la negligencia en su uso, la mala fe, es decir, un intento
deliberado de distorsionar la realidad y conocimientos insuficientes, falta
de información o información errónea. Esta última fuente es, con diferencia,
la causa más frecuente del uso inapropiado de los tests.
Atajar este problema supone necesariamente regular el uso de los tests. La
cuestión es cómo y cuánto.
Fuentes de regulación.
Las fuentes de regulación del uso de los tests pueden proceder desde
distintos frentes. Por ejemplo, se puede trabajar desde la propia industria
de los tests, desde organizaciones o colegios profesionales o desde la misma
administración pública (Wigdor y Garner, 1982). En cualquier caso, se trata
de maximinar la excelencia técnica de las pruebas y la preparación de los
usuarios. No hay recetas mágicas para ello, pero parece que la mejor fórmula
consiste en combinar la formación de los usuarios con la restricción en el
acceso a los tests de personas no cualificadas aunque, a la larga, los
esfuerzos por mejorar la formación son más eficientes que la mera
restricción en el uso (Fremer, 1996; Tyler, 1986).
Desde hace tiempo, el Colegio Oficial de Psicólogos viene realizando
diversas actividades para mejorar el uso y la práctica de los tests en
España.
A nivel nacional, se formó en su día una comisión de tests constituida por
universitarios, profesionales y casas editoras que trata de discutir y
proponer medidas tendentes a la mejora del uso de los tests en España (véase
la página web del colegio http://www.cop.es para obtener información
relativa a estas medidas).
A nivel internacional, el Colegio Oficial de Psicólogos participa en la
International Test Commission, organismo encargado de potenciar un uso
adecuado de los tests a nivel internacional. Este organismo está ultimando
unas normas internacionales para el uso de los tests que verán la luz en el
2000. Estas normas se articulan en torno a dos grandes apartados: el uso
ético de los tests y la utilización adecuada de los tests.
Existe también una comisión europea para el estudio y mejora de la
construcción y uso de los tests en Europa.
Contacto y comentarios
Puedes comentar este texto aquí: Comentarios
También puedes contactar con el administrador en este enlace: Contacto