C10-Mesure

Objectif de la note

Cette note reprend le cours 10 sur la mesure à partir d’où on était au dernier cours, soit à la diapositive 16. L’objectif est de complémenter les diapositives et remplacer en partie les discussions en classe. Vous pouvez laisser des commentaires si vous aimeriez des éclaircissements sur le contenu de cette publication.

Matériel complémentaire pour l’étude

• Les diapositives du cours 10 sur la mesure
• Les lectures associées au cours 10

Commentaires en lien avec les diapositives

Nous avions arrêté aux mesures introspectives (diapo 16). Je vais donc pour cette note. Pour vous aider à suivre, j’indiquerai le numéro de la diapositive que je commente dans le texte (ex: D16 pour diapositive 16).

D16

Les méthodes introspectives ont principalement été développées pour étudier la conscience, la perception et la phénoménologie (ex: voir l’approche de Wilhelm Wundt en psychologie de la perception). Par contre, ces méthodes sont maintenant rarement utilisées. Elles consistent, en gros, à observer soi-même le contenu de son expérience subjective, et à rapporter soi-même le résultat de ces observations. Comme nous avons un accès direct à nos expériences subjectives (ex: nos émotions, pensées et perceptions), nous sommes les seuls à pouvoir les « observer » directement. Par contre, ces méthodes ont des limites importantes:

Le fait d’être à la fois observateur et participant/sujet empêche l’observation d’être neutre;
Comme il est impossible d’observer directement les expériences subjectives de quelqu’un d’autre (nous somme incapable de lire dans les pensées), il est impossible d’avoir un observateur externe ou un accord-interjuge;
Pour s’assurer que l’observateur/participant rapporte adéquatement ses expériences, l’observation est généralement précédée par un entrainement intensif et doit être faite dans un environnement contrôlé pour assurer un minimum de constance et de validité dans les observations, de la même façon qu’un oenologue doit s’entrainer à déguster des vins pour réussir à différencier les caractéristiques perceptuelles de différents vins.

L’exemple le plus fréquent de mesure introspective est l’utilisation d’un journal de bord par un chercheur pour suivre ses propres expériences subjectives (ex: opinions, rêves, symptômes) dans le temps. Par exemple, l’étude de Bulkeley (2018) présente une analyse d’un journal de rêves maintenu par une femme pendant 30 ans.

D17

Les mesures de contenu verbal sont probablement les mesures les plus communes en sexologie, et en sciences sociales de façon générale. Elles représentent, en gros, le fait de poser des questions à de multiples participants et de recueillir leur réponse. Ces questions peuvent être posées dans le cadre d’une entrevue de recherche ou d’un questionnaire (en version papier ou en ligne). Il est impossible d’observer ou mesurer directement le contenu des expériences subjectives de quelqu’un d’autre. Par contre, il est possible de demander à un participant de rapporter ses propres expériences subjectives (ex: pensées, émotions, souvenirs,…) et le témoignage de ce participant peut être considéré comme une représentation indirecte de ses expériences. C’est cette équivalence (imparfaite mais utile) entre contenu verbal (ce qui est dit ou exprimé) et contenu mental (ce qui est vécu) qui permet d’investiguer quantitativement les expériences subjectives d’un échantillon de plusieurs participants. Comme pour les mesures introspectives, les mesures de contenu verbal impliquent que les participants sont aussi ceux qui observent leurs propres expériences subjectives, ce qui veut dire que les observateurs ne sont pas neutres. Par contre, au lieu de miser sur un seul participant/observateur entrainé, les mesures de contenu verbal misent généralement sur plusieurs participants non-entrainés.

Comme la qualité des mesures de contenu verbal dépendent de la qualité de la mémoire et du jugement de chaque participant, il est important de tenir compte des possibles biais cognitifs dans l’interprétation des résultats de ces types de mesure.

D18

Cette diapositive présente les types de mesure du contenu verbal parmi les plus communes en sciences sociales. Elles peuvent autant être présentées sous forme écrite (ex: dans un sondage en ligne) qu’à l’oral (ex: dans le cadre d’une entrevue), quoique les questions ouvertes soient les plus adaptées au format entrevue.

D19 – Les questions ouvertes

Ce sont des questions dont la réponse est donnée verbalement (à l’écrit ou à l’oral) sans qu’on offre aux répondant.es de choix de réponses. Les réponses attendues peuvent être très courtes (ex: « Quelle est votre couleur préférée? » « Quelle application de rencontre utilisez-vous le plus fréquemment? » « Quelle expression utilisez-vous généralement pour décrire votre orientation sexuelle? ») ou plus longues (ex: « À quoi ressemblerait le partenaire idéal pour vous? » « Décrivez le contexte dans lequel vous avez rencontré votre dernier partenaire sexuel » « Quelles méthodes utilisez-vous pour réduire les risque de transmission du VIH lorsque vous avez des relations sexuelles avec un partenaire au statut sérologique positif ou inconnu? »).

Les réponses à des questions ouvertes, peuvent être analysées de façon qualitative ou quantitatives. Nous n’aborderons pas l’approche analytique en méthodes qualitatives. Dans le cadre d’une approche quantitative, le contenu des réponses à une question ouverte ne peut généralement pas être directement analysé. Comme chaque répondant.e est libre de répondre à sa façon, les réponses ne peuvent pas être directement comparées entre répondant.es. L’analyse des réponses à une question ouverte demande donc généralement de traduire la réponse textuelle en information quantitative. Par exemple, on pourrait reclassifier les différentes orientations sexuelles en un nombre réduit de catégories puis préciser, pour chaque répondant.e, dans quelle catégorie est classifiée sa réponse.

D20 – Les questions fermées

Ce sont des questions pour lesquelles les choix de réponse sont déjà prédéfinis et limités.

Exemple 1: Vous considéré comme étant: (a) hétérosexuel, (b) bisexuel, (c) homosexuel, ou (d) je ne sais pas?
Exemple 2: Combien de partenaires sexuels avez-vous eu durant les derniers 12 mois?

Comme les choix de réponses sont limités et standardisés, les résultats à des questions fermées peuvent être directement comparées entre répondant.es, compilées et analysées. Par contre, ce type de question ne permet pas aux répondant.es de répondre en dehors des choix spécifiques qui sont décidés préalablement. La qualité des réponses peut donc être affectée si des options de réponses pertinentes pour les répondant.es sont omises. Par exemple, la réalité d’un répondant qui s’identifie dans la vie de tous les jours comme étant asexuel ou hétéroflexible ne pourrait pas être capturée adéquatement par la question de l’exemple 1.

D21 à D25 – Les échelles auto-rapportées

Les échelles auto-rapportées sont utilisées pour mesurer des concepts de façon ordinale. Ce sont généralement des types de questions fermées dont les choix de réponses sont ordonnés selon un certain gradient.

Traditionnellement, les échelles de Likert sont des questions fermées formulées de façon déclarative (et non sous forme de question) pour lesquelles les répondant.es ont à se positionner en spécifiant leur niveau d’accord (ex: de Fortement en accord à Fortement en désaccord). Par extension, on catégorise souvent comme échelle de Likert des échelles similaires qui mesurent d’autres concepts que le degré d’accord. Par exemple, des échelles de satisfaction (de Très satisfait à Très insatisfait), de fréquence (de Jamais à Très souvent) ou d’ampleur/intensité (de Pas du tout à Énormément). Un des éléments importants à considérer lorsqu’on développe ou analyse des échelles de Likert est la présence ou non d’un point milieu qui représente une position neutre ou indifférente. Comparez, par exemple, une échelle en quatre points ([a] fortement en accord; [b] modérément en accord; [c] modérément en désaccord; [d] fortement en désaccord) à une échelle en cinq points ([a] fortement en accord; [b] modérément en accord; [c] ni en accord ni en désaccord; [d] modérément en désaccord; [e] fortement en désaccord). Lorsqu’il n’y a pas de point milieu, cela force les répondant à se positionner d’un côté ou de l’autre, même s’ils sont indifférent à la question posée. Lorsqu’il y en a un, cela permet aux répondants de signaler leur indifférence ou neutralité et de ne pas se positionner d’un côté ou de l’autre. Par conséquent, la proportion de répondant.es indiquant être en accord (fortement ou modérément) sera généralement moins élevée lorsque les choix de réponse incluent un point milieu. Et il en est de même pour la proportion de répondant.es indiquant être en désaccord.

Les échelles par différentiateur sémantique et les échelles par analogie visuelle reprennent grosso modo la même logique que pour les échelles de Likert, mais présentent les choix de réponse sous un autre format. Ces deux types d’échelle sont utilisées pour permettre aux répondant.es de positionner leur réponse entre deux concepts qui s’opposent (ex: « Je suis attiré sexuellement par: Les femmes/Les hommes » « Mes rêves sont généralement: Agréables/Désagréable »). Dans le cas d’une échelle par différentiateur sémantique, les répondant.es précisent leur réponse en encerclant la valeur représentant leur situation par rapport aux deux pôles. Par exemple, si on utilise une échelle en 7 points pour préciser si l’on est attiré par les femmes (1) ou les hommes (7), une valeur de 4 représente une attirance équivalente et une valeur de 1 représente une attirance exclusivement aux femmes. Les échelles par analogie visuelle fonctionnent comme celles par différentiateur sémantique, mais les valeurs numériques sont remplacées par une ligne et les répondants doivent faire un trait (ou un x) à l’endroit sur la ligne qui représente leur réponse par rapport aux deux pôles. La réponse est ensuite traduite numériquement en calculant la distance entre le trait et chacun des pôles.

Le Genderbread Person, par exemple, permet de capturer le genre, le sexe biologique et l’orientation sexuelle d’un répondant à partir de 8 échelles par analogie visuelle.

Les échelles de Guttman (aussi appelées échelles cumulatives) sont aussi des questions fermées dont les choix de réponse sont ordonnée. Dans ce type d’échelle, les choix de réponse sont des énoncés présentant, de façon hiérarchique, des situations représentant différentes niveaux d’endossement de la dimension mesurée.

Exemple 1: Le niveau d’implication syndicale des répondant.es peut être évalué à partir de cette question: « Voici des énoncés concernant votre implication syndicale. Cochez, pour chacun, s’ils s’appliquent à vous ou non.
1) Je suis membre d’un syndicat. Oui/Non
2) Il m’arrive de lire l’information que m’envoit mon syndicat. Oui/Non
3) Il m’arrive d’aller aux réunions de mon syndicat. Oui/Non
4) Je fais partie d’un des comités de travail de mon syndicat. Oui/Non
5) Je fais partie du comité exécutif de mon syndicat. Oui/Non »

La valeur attribuée à chaque répondant.e correspond à l’item le plus élevé (dans la hiérarchie) qui a été coché positivement. Dans l’exemple 1, quelqu’un qui répond oui aux questions 1, 2 et 3 se verrait attribuer la valeur 3.

Les échelles de Guttman supposent une certaine hiérarchie entre les items, ce qui implique que les répondant.es cochant Oui à un des items devraient logiquement cocher Oui à tous les items précédents. Par contre, ce n’est pas toujours le cas dans la réalité. Dans notre exemple, il serait théoriquement possible que quelqu’un se présente aux réunions de son syndicat mais ne lise jamais l’information envoyée par le syndicat. Dans une telle situation, on peut quand même attribuer la valeur correspondant à l’item le plus élevé dans la hiérarchie. Par contre, cela introduit une certaine imprécision dans la mesure.

Par extension, on réfère parfois à des questions à choix multiples comme étant des échelles de Guttman lorsque les choix sont des énoncés suivant une hiérarchie similaire aux échelles de Guttman traditionnelles. La question présentée en D25 en est un exemple.

D26 – Les mesures à items multiples

Très souvent, un concept ne sera pas mesuré par une seule question de type Likert, mais par un ensemble de questions apparentées de type Likert. Par exemple, l’échelle d’estime de soi de Rosenberg (1965) mesure l’estime de soi à partir de 10 questions de type Likert allant de Fortement en accord à Fortement en désaccord. Ces questionnaires sont généralement développés et validés par des procédures statistiques pour s’assurer que les items regroupés ensembles représentent bien un même concept. Avec ces mesures, un score global est calculé à partir de l’ensemble des réponses puis attribué à chaque répondant.e. Une valeur est premièrement attribuée à chaque choix de réponse (ex: de Fortement en désaccord = 1 à Fortement en accord = 4), puis la somme ou la moyenne des valeurs aux différents items est calculée. Lorsqu’un tel questionnaire inclut des énoncés dont le sens est à l’opposé du concept mesuré (ex: la question 2 de l’échelle d’estime de soi citée ci-haut, soit « At times I think I am no good at all »), les valeurs associées aux différents choix de réponses sont inversées avant de calculer le score global pour assurer la cohérence avec les autres énoncés.

Les mesures à items multiples peuvent théoriquement être faites à partir d’autres échelles auto-rapportées que des échelles de Likert (ex: différentiateurs sémantiques, Guttman,…). Par contre, cela arrive très rarement en pratique.

D27 à D30 – Les mesures socioculturelles

Lorsqu’on cherche à mesurer un phénomène au niveau socioculturel, c’est souvent beaucoup plus difficile à faire directement que pour un phénomène individuel. Les prochaines diapositives présentent certaines des principales méthodes de mesure socioculturelles utilisées en sciences sociales.

Dominic Beaulieu-Prévost

Professeur, département de sexologie (UQÀM)