La Psychométrie

La psychométrie est une sous-discipline scientifique de la psychologie, généralement inconnue du grand public. Pourtant, elle fait partie de la formation universitaire des psychologues, et est d’une grande importance. Elle permet aux psychologues d’objectiver leurs observations, et de quantifier des situations psychologiques.
Vous connaissez les fameux tests de QI ? Alors vous avez déjà une intuition de ce qu’est la psychométrie.

Qu’est-ce que la Psychométrie ?

Wikipédia donne la définition suivante de la psychométrie : « la science qui étudie l’ensemble des techniques de mesures pratiquées en psychologie, ainsi que les techniques de validation et d’élaboration de ces mesures ». Elle comprend donc différentes activités :

– La mesure de caractéristiques psychologiques. Ex. : la psychométrie permet d’évaluer l’attention, la mémoire, la personnalité, l’anxiété, le risque de récidive criminelle …

– Le développement des outils qui permettent ces mesures. La psychométrie s’intéresse en effet à la création, la validation, la traduction et l’étalonnage des tests et échelles.

Mesurer des caractéristiques psychologiques

Établir une mesure d’une caractéristique psychologique peut avoir deux intérêts majeurs pour un psychologue :

Objectiver une observation

Le plus souvent, le psychologue effectue une observation d’un patient, et en interprète quelque chose pour baser ses conclusions. On appelle cette pratique le jugement clinique non structuré. Or, les études montrent que, lors d’une expertise criminologique, les psychologues qui utilisent uniquement le jugement clinique non structuré rendent des conclusions dont la fiabilité est à peine supérieure au hasard. Le psychologue reste un humain, avec des biais et des erreurs. Son expertise ne suffit pas à lui faire prendre des décisions parfaites.

Les tests et échelles permettent donc de compléter le jugement clinique en lui fournissant une structure (que chercher ? dans quel ordre ? quels éléments ne sont pas pertinents ?). On parle alors de jugement clinique structuré. Le test fournit un score, une catégorie, une étiquette, qui sont objectifs et comparables avec d’autres personnes. L’utilisation des tests permet donc de vérifier que l’on ne se trompe pas. Elle permet aussi d’harmoniser les jugements entre différents cliniciens.

Quantifier un phénomène

Au-delà d’objectiver l’existence d’une caractéristique, la psychométrie permet aussi de la quantifier. Par exemple, on détecte un épisode dépressif caractérisé, mais on cherche à évaluer son intensité.

Les outils psychométriques fournissent ici aussi une mesure permettant de classer l’individu par rapport à d’autres personnes de la même population, pour mesurer la fréquence ou l’intensité d’un problème ou d’un comportement.

La plupart du temps, on cherche à quantifier un phénomène qui est problématique pour la personne. Cela peut être la gravité d’une addiction, la sévérité d’un épisode dépressif, l’intensité d’un déficit intellectuel, etc. Souvent, cette mesure aide à différencier une difficulté normale d’une difficulté pathologique. Par exemple, toutes les personnes âgées ont des petits oublis, mais cela n’implique pas toujours la présence d’une maladie neurodégénérative !

Développer des outils psychométriques

Différentes étapes jalonnent le processus de développement d’un nouvel outil :

Création

Lorsqu’on crée un outil, on doit identifier plusieurs choses :

– Que mesure l’outil ? À quoi sert-il ? On peut mesurer un comportement, un trait, un trouble psychiatrique, un risque, une caractéristique … De nombreux outils manquent de fiabilité car ils mesurent trop de choses à la fois. D’autres s’intéressent à une chose, mais en mesurent en réalité une autre.

– À qui l’outil s’adresse-t-il ? Cherche-t-on à faire une mesure chez un enfant, un adolescent, un adulte, une personne âgée ? La personne sait-elle lire ? Est-elle touchée par un handicap ? Est-elle en prison ou à l’hôpital ? La mesure devra être adaptée et accessible à la personne rencontrée.

– Comment prend-on la mesure ? Est-ce que la personne remplit elle-même une questionnaire ? Est-ce que le clinicien le remplit lui-même ? S’agit-il d’une réponse à donner, de cases à cocher, d’une tâche à faire ? Cette question est d’une grande complexité et prend généralement le plus de temps. Certains outils, par exemple ceux évaluant le quotient intellectuel, combinent différentes mesures et exercices.

– Comment va-t-on interpréter le test ? Est-ce qu’il donne un score qui augmente selon la gravité ? Est-ce qu’il propose différentes catégories dans lesquelles répartir les personnes ? Ou plutôt un continuum le long duquel on se place ? Une probabilité ? Le type de résultat obtenu sera corrélé avec la mesure choisie.

Validation

Le processus de validation d’un outil psychométrique est le moins connu du grand public. Pourtant, c’est le plus important, et certainement celui qui prend le plus de temps. Il permet de vérifier les qualités de l’outil, afin d’indiquer si l’on peut s’en servir et avec quel niveau de confiance.

De manière simplifiée, les qualités psychométriques d’un outil sont :

Sa validité

Est-ce que l’outil mesure bien ce qu’il est censé mesurer ? Si j’évalue l’intelligence en mesurant combien de pommes de terre une personne peut lancer dans un seau en une minute, j’obtiendrai un score, mais il ne correspondra sûrement pas à ce que je cherche. Cette question est beaucoup plus ardue quand on veut mesurer des concepts complexes, comme l’intelligence, ou le risque de comportement violent.

Sa fidélité

Si je fais passer le même test deux fois à la même personne à quelques heures, semaines, années d’intervalle, obtiendrai-je un résultat similaire ? On l’appelle parfois fidélité test-retest, ou reproductibilité. Certains outils ne sont pas réutilisables pour une même personne, car ils permettent un effet d’apprentissage. La personne peut donc obtenir un meilleur score que la fois précédente, même si elle ne s’est pas amélioré en général.

Sa fiabilité

Si deux professionnels différents évaluent la même personne avec le même outil, vont-ils trouver des résultats identiques ? On peut imaginer les difficultés posées par un outil avec une mauvaise fiabilité. Il n’est pas si objectivant que cela. On appelle également la fiabilité fidélité inter-juge.

Sa sensibilité

Ou capacité de discrimination. Est-ce que l’outil arrive à distinguer finement des catégories de personnes ou des scores ? Par exemple, est-ce que des personnes très différentes vont bien obtenir des scores différents ? Est-ce que des personnes assez similaires vont quand même pouvoir être différenciées avec nuance ?

Ces qualités sont évaluées par des études expérimentales, où l’outil est utilisé avec de nombreux professionnels, contextes, personnes. Les résultats sont ensuite décortiqués à l’aide d’analyses statistiques. Ces analyses permettent aussi de s’assurer que le test est aussi utile que possible, et que son résultat n’est pas dû au hasard. Si un trait est mesuré par 10 questions différentes (appelées items), mais qu’un seul suffit pour obtenir une réponse fiable, on peut supprimer les autres. Cela rendra la passation du test plus simple.

Traduction

La plupart du temps, les études scientifiques sont publiées en anglais, parfois en français. Cependant, avant d’utiliser un outil, il est nécessaire de le traduire dans la langue de ses utilisateurs. D’une part, cela permet tout simplement aux personnes de pouvoir répondre aux questions. D’autre part, certains termes sont assez sensibles à la traduction, ce qui risque de changer les résultats obtenus, et donc les qualités psychométriques de l’outil. La validation d’un test doit donc être refaite pour chacune de ses traductions, ce qui prend du temps.

Étalonnage

Définition de l’étalonnage

L’étalonnage d’un test est la répartition des scores obtenus dans la population d’intérêt. Par exemple, pour un test de « QI », la moyenne de la population française est 100, mais 68 % des gens obtiennent un score entre 85 et 115. Seuls 5 % des Français obtiennent un score inférieur à 70 ou supérieur à 130. Le score n’est donc pas réparti de manière linéaire dans la population. (Ex. : 10 % des gens avec un score de 0 à 10, 10 % avec un score de 10 à 20, 10 % avec un score de 20 à 30, etc.)

Intérêts de l’étalonnage

Il est donc nécessaire d’étalonner un test avant de l’utiliser sur une population pour deux raisons :

– Voir quels sont les écarts de résultats d’une personne à l’autre, au sein de la population. On appelle cette mesure l’écart-type. Sans cette répartition, il est impossible de savoir ce qui constitue un résultat normal ou pathologique.

– S’assurer que l’on connait la répartition de résultats de la population pour laquelle on l’utilise. En effet, ces écarts de résultats ne sont pas les mêmes partout. Par exemple, les femmes ont un risque de récidive violente beaucoup plus faible que les hommes. Il n’est donc pas fiable d’utiliser avec une femme un outil qui aurait uniquement été étalonné sur une population masculine. Il serait impossible d’interpréter correctement le résultat obtenu. Autre exemple, pour un même test traduit en français, des adolescents français n’auront pas forcément les mêmes scores que des adolescents québécois ou belges.

Le processus de développement d’un outil est donc très long, puisqu’il nécessite d’être validé, étalonné, et éventuellement traduit, pour chaque nouveau contexte dans lequel on souhaite l’utiliser. Il existe ainsi de multiples tests très précieux encore inutilisables en France, car ils n’ont pas encore fait l’objet de cette procédure. Cela peut parfois prendre plusieurs décennies.

Les outils actuariels

Les expertises criminologiques utilisent un type de test supplémentaire un peu différent des autres : les outils actuariels. Ce nom désigne des tests qui cherchent non pas à mesurer une dimension actuelle chez un individu, mais à prédire un comportement futur.

Typiquement, les outils d’évaluation du risque de récidive font partie de ce type d’outils. Leurs qualités psychométriques sont généralement moins bonnes que les autres outils, ce qui est parfaitement normal. Il est beaucoup plus difficile de prédire l’avenir que de constater le présent !

Les tests actuariels peuvent pourtant atteindre une très bonne validité (plus de 75 %, ou encore plus de 90 % de réussite). Elle est en tout cas systématiquement meilleure que le jugement clinique non structuré pour prédire d’éventuels comportements futurs.

Ce type de calcul statistique a initialement été créé par les assurances, pour calculer quels individus étaient plus à risque d’avoir un accident, et donc de devoir être indemnisé… On peut également les imaginer en médecine, par exemple pour établir un pronostic.

Formation des professionnels

Une fois un outil psychométrique créé, il ne peut pas pour autant être utilisé par n’importe qui. D’une part, les items mesurés nécessitent parfois un niveau d’expertise élevé pour être repérés. (Savez-vous dire si votre interlocuteur est catatonique ?) D’autre part, même pour des professionnels diplômés, la plupart des outils nécessitent une formation spécifique avant de pouvoir être utilisés. Ce besoin de formation complémentaire s’explique de plusieurs manières :

Utilisation

Chaque outil est conçu avec un contexte d’utilisation en tête, qui doit être respecté pour préserver ses qualités psychométriques. Ce contexte peut être clinique, ex. : pour quel type de symptôme mnésique tel test de mémoire peut être utilisé ? Il peut aussi être situationnel (est-il adapté pour des personnes hospitalisées ?), ou encore dépendre des caractéristiques individuelles (ce test pour adultes peut-il être utilisé avec des adolescents ?).

Passation

La passation d’un test (= le moment où le professionnel le fait passer à son patient) peut être assez complexe. Certaines peuvent durer plusieurs heures, ou comprendre plus d’une dizaine d’étapes. Pour de nombreux tests neuropsychologiques, des étapes ou des temps d’attente entre deux tâches doivent être chronométrés.

On peut donc aisément imaginer l’intérêt d’avoir un professionnel briefé et entraîné à la passation d’un test, pour que les résultats obtenus soient utilisables.

« Attendez… Qu’est-ce que je devais vous demander ensuite, déjà ? »

Interprétation

Une fois les résultats obtenus, deux étapes sont nécessaires pour pouvoir les comprendre et les utiliser :
– La cotation du test. Il s’agit d’attribuer les scores ou les catégories correspondant à chaque item. Beaucoup de tests neuropsychologiques impliquent de transformer certains scores bruts par quelques calculs, pour obtenir des scores standardisés. Le cursus universitaire des psychologues comprend plusieurs semestres de statistiques obligatoires… Les statistiques sont également utiles dans le processus de recherche.
– L’interprétation du test. Savoir ce que signifie chaque résultat (est-ce que 10 est un score moyen ou très grave ?) ne peut en général pas s’inventer, même avec l’étalonnage sous les yeux, et nécessite donc une formation préalable.

Restitution

Cela peut paraître peu intuitif, mais la restitution d’un bilan demande également des compétences spécifiques. La restitution peut être le fait d’expliquer les conclusions à l’oral au patient demandeur, à l’écrit par un bilan, généralement les deux. Dans un contexte judiciaire, il peut aussi inclure une soutenance du rapport d’expertise devant la Cour.

Une formation est intéressante pour savoir quels éléments transmettre (fournit-on les scores bruts ou non ?) et comment les transmettre pour chaque test (peut-on dire que cette personne est un psychopathe ?).

En conclusion, si vous voyez un professionnel proposer des tests, mais qu’il ne mentionne ni être psychologue (ou neuropsychologue), ni psychiatre, fuyez. Il ne peut pas disposer des compétences nécessaires pour faire une évaluation de qualité, qui ne s’obtiennent que par des diplômes universitaires et des formations complémentaires spécifiques. La passation de tests est donc normalement réservée aux professionnels détenteurs d’un titre.

Le système international d’édition

La plupart des outils psychométriques ne sont pas trouvables sur internet. Ils sont distribués par des maisons d’édition, qui requièrent d’acheter chaque test, voire son manuel et sa formation spécifique. Certains tests nécessitent d’être payés à chaque utilisation.

Ce système a des avantages : protection des tests contre les malpratiques, garantie de formation, protection de droits d’auteurs. Il freine cependant l’accès à l’utilisation des outils, mais aussi leur processus de validation, de traduction et d’étalonnage. Certains chercheurs décident donc, de plus en plus fréquemment, de publier leurs travaux en libre accès.

Dernière mise à jour de cette page : 01 / 04 / 2024.