La validez de los test se refiere al grado en que estos miden lo que realmente quieren medir (Kelley, 1927) [1]. Al grado en que la puntuación de una medición representa la variable a la que está destinada.

Y es que no basta con que un test posea fiabilidad. Es preciso que también sea pertinente.

Es decir, que proporcione informaciones útiles para la decisión que haya que adoptar.

En el contexto de la selección de personas, esta utilidad puede definirse de dos modos distintos:

  • procediendo a la verificación experimental de la capacidad predictiva de dichas técnicas.

La validez de los test psicológicos se establece con relación a un propósito específico. Así, una prueba puede no ser válida para diferentes propósitos. Por ejemplo, un test utilizado para medir la competencia técnica puede no ser válido para estimar la capacidad liderazgo.

Tipos de Validez de los Test

Normalmente suelen distinguirse tres tipos de validez:

Validez de Contenido

Corresponde al grado en que una técnica de evaluación muestrea el ámbito de los comportamientos para los que se desea establecer una predicción. Se relaciona por tanto estrechamente con el análisis del puesto, suponiendo que:

  • Se describa con claridad el rendimiento profesional.
  • Los objetivos de la técnica de evaluación se formulen correctamente.
  • Se realice adecuadamente el muestreo del campo profesional.

El procedimiento a seguir para mostrar el grado de validez de contenido sería:

  • Un análisis de trabajo que permita precisar los conocimientos, aptitudes, capacidades o comportamientos esenciales que se puedan describir y cuantificar y que estén relacionados con la tarea profesional.
  • La elaboración del test, procurando que se corresponda con los resultados del análisis de trabajo.
  • Evaluación de la pertinencia del test en relación con la actividad profesional en cuestión. Esta evaluación se realiza mediante el juicio de varios expertos que son consultados al respecto.

Validez de Constructo

Representa la capacidad de un test para medir la variable que debe juzga; y de hacerlo de acuerdo con un modelo teórico existente. Interesa siempre que haya de interpretarse una prueba como medida de una cualidad o atributo que no esté claramente definida. Existirían así dos categorías de evaluación:

  • Las que se bastan a sí mismas, porque resulta fácil definir el campo que abarcan.
  • Las pruebas destinadas a medir una cualidad (inteligencia, aptitud numérica,…) o incluso un rasgo de personalidad. Aquí, el objeto de la medición es una noción abstracta relacionada con una teoría psicológica y definida por ella.

       Existen tres métodos para medir la validez de constructo:

  • En primer lugar, la verificación de que la técnica de evaluación da unos resultados que guardan correlación con los obtenidos mediante técnicas más experimentadas que saben bien lo que miden.
  • Un segundo método es el análisis factorial. Mediante este procedimiento, se aísla y definen los factores que dan cuenta de las relaciones que existen entre las variables de medida.
  • El procedimiento «multirrasgos-multimétodos», que consiste en mostrar que test diferentes, que midan el mismo factor o el mismo concepto, guardan correlación entre sí, pero no con test que midan otros rasgos o factores, aun cuando estos últimos utilicen los mismos métodos.

Validez Predictiva

Otro modo de abordar la validez de los test es el enfoque predictivo. La validez predictiva relaciona los test con el éxito profesional en sí.

Se trata de comparar los resultados del pronóstico con la realidad del rendimiento obtenido en un criterio, previendo un intervalo de tiempo entre la recogida de las informaciones predictivas y la recogida de informaciones criterio. Es decir, a los candidatos se les somete al test que vamos a validar, obteniendo la medida del criterio, tras un tiempo determinado.

A pesar del gran valor de este procedimiento de validación, presenta un inconveniente importante: no se puede poner en práctica más que en las organizaciones grandes, en las que se puede reclutar a los candidatos y luego asignarlos a puestos diferentes.

Existen, no obstante, alternativas que permite en parte soslayar este problema, al tiempo que posibilita mayor rapidez en el proceso de validación.

Se trata de la validez concurrente. Fundamentalmente consiste en administrar la prueba a los empleados actuales, al tiempo que se obtienen medidas acerca del rendimiento en el puesto de trabajo. La validez vendría dada por la correlación entre ambas puntuaciones. Este procedimiento tiene la ventaja de proporcionar resultados inmediatos, pero presenta algunos inconvenientes:

  • La población sobre la que se ha reunido la información no es representativa de lo que sería un grupo de candidatos. Esto es así porque no se ha realizado una criba previa en el proceso de selección. Por otra parte, es probable que las personas que no tuvieran un nivel de rendimiento satisfactorio hayan abandonado el puesto.
  • Los candidatos sometidos a pruebas de evaluación se sienten más motivados que aquellos a quienes se les pide que se presten para realizar una investigación.
  • Las diferencias detectadas entre los individuos pueden deberse a los conocimientos adquiridos con la experiencia profesional.

Interpretación de los Coeficientes de Validez

El coeficiente de validez expresa la correlación existente entre la puntuación de un test y la medida de un criterio utilizado para comprobar dicha validez.

En este sentido es similar al coeficiente de fiabilidad ya que explora la relación entre dos variables.

Como norma, a mayor coeficiente de validez de los test, más utilidad. Al respecto, hay que tener en cuenta que coeficientes de r = 0.21 a r = 0.35 son habituales cuando el test consta de una sola prueba. 

Por su parte, los test que utilizan pruebas múltiples generalmente tendrán mayores coeficientes de validez. De cualquier modo, es preciso consultar la información sobre la validez de las pruebas.

La figura siguiente representa una orientación para guiarse a la hora de seleccionar un test individual. En todo caso, tenga en cuenta que la utilización de test formados por varias pruebas arrojará, generalmente, mayores niveles de validez.

validez de los test - interpretación

Observe cómo coeficientes por debajo de 0,11 no son aconsejables. La utilidad se da a partir de r = 0,11, pero únicamente cuando la precisión exigida al resultado no es muy alta. Por ejemplo, cuando no hay disponible un número elevado de candidatos, o el nivel de de exigencia de los puestos no es elevado.

Es a partir de 0,21 cuando una prueba comienza a ser realmente útil, considerando que con 0,35 ya es de alta utilidad.

Recomendación


Aplique únicamente test que hayan demostrado ser validos para el objetivo específico que se haya planteado. Recuerde que, si necesita un alto grado de precisión en la medición, la validez de los test a utilizar debe ser elevada.


Nota

[1] Kelley, T. L: Interpretation of educational measurements. New York: Macmillan, 1927.

Validez de los Test Psicológicos(c)Aiteco Consultores, SL
Share This