Adaptation à la maladie de Lyme: comparaison des modes de collectes de données par téléphone et web - Mémoire Grace Ngambo Domche Maîtrise en ...

 
CONTINUER À LIRE
Adaptation à la maladie de Lyme: comparaison des
modes de collectes de données par téléphone et web

                            Mémoire

                    Grace Ngambo Domche

         Maîtrise en mesure et évaluation - avec mémoire
                       Maître ès arts (M.A.)

                        Québec, Canada

                 © Grace Ngambo Domche, 2021
Adaptation à la maladie de Lyme:
Comparaison des modes de collectes de données par
                téléphone et web

                          Mémoire

                       Grâce Ngambo

                    Sous la direction de :

             Pierre Valois, directeur de recherche
Résumé

Le mode de collecte web gagne de plus en plus de popularité depuis sa création, ceci notamment
en raison des avantages qu’il apporte en termes de coût et de temps. Cependant, les tendances non-
probabilistes des échantillons web font souvent douter de leur capacité à fournir des résultats aussi
représentatifs que ceux d’un mode traditionnel typique tel que le téléphone. Le but de ce mémoire
est de comparer les modes non-probabiliste web et probabiliste téléphone souvent suggérés par les
firmes de sondage au Québec. Nous analysons principalement les éventuelles différences entre les
échantillons web et téléphone du point de vue de l’adaptation à la maladie de Lyme. Plus
spécifiquement, les trois objectifs de l’étude sont de : (1) comparer la représentativité des deux
échantillons avec les données du recensement en termes de caractéristiques sociodémographiques,
(2) comparer ces modes d’enquête en ce qui concerne l’estimation des taux d’adoption de
comportements préventifs à l’égard de la maladie de Lyme tel que rapportés par les répondants
aux deux sondages, et (3) tester l’invariance de la mesure des comportements préventifs des
échantillons non probabiliste (panel Web) et probabiliste (téléphone). Les données proviennent
d’une étude sur les comportements d’adaptation à la maladie de Lyme. Les échantillons panel Web
(n=956) et téléphone (n=1003) sont constitués de résidents québécois de 18 ans et plus habitant
les régions de risques faible à significatif. Les résultats montrent premièrement qu’aucun des
échantillons n’est représentatif de la population cible au regard des caractéristiques
sociodémographiques telles que rapportées dans le recensement canadien de 2016. Deuxièmement,
nos résultats indiquent que le taux de non-réponse aux comportements préventifs d’adaptation à la
maladie et autres variables associées est significativement plus élevé dans l’échantillon web.
Cependant, la magnitude de cette différence est nulle pour 19 items sur 30, et faible pour les 11
autres. De plus, aucune différence importante n’a été relevée lors de la comparaison des deux
échantillons du point de vue de l’estimation de la prévalence desdits comportements et leurs
déterminants. Enfin, les analyses d’invariance de l’indice d’adaptation ou de prévention à l’égard
de la maladie de Lyme révèle que la structure de l’indice est la même pour les deux échantillons.
On en conclut que malgré certaines différences observées entre les modes web et téléphone, les
répondants des deux échantillons ont tendance à adopter des comportements similaires
d’adaptation à la maladie de Lyme.

                                                 ii
Abstract

The web data collection mode has been increasing in popularity since its creation, primarily due
to its cost and time effective benefits. However, its non-probabilistic tendencies often bring doubts
concerning the representativity of its results in comparison to a typical mode such as the telephone.
This master’s thesis compares the non-probability web and probability telephone modes, often
suggested by polling firms in the province of Quebec. It principally analyzes the eventual
differences between both samples on their adaptation to the Lyme disease. More specifically, the
three main goals of this study are: (1) to compare the representativeness of both samples with the
census data in terms of their socio-demographic characteristics, (2) to compare those two survey
modes regarding their respondents’ preventive behaviour estimates against the Lyme disease, and
(3) to test the measurement invariance of the nonprobability (Web panel) and probability
(telephone) samples’ preventive behaviour. The data comes from a study on the adaptation of
prevention behaviors against Lyme disease. The web (n=956) and telephone samples (n=1003) are
made of individuals, 18 years old and above, from low and significant risk regions. Results firstly
reveal that neither survey is representative of the Canadian census of 2016. Secondly, results show
that the non-response rate for Lyme disease prevention adaptive behaviors and other associated
variables is higher in the web survey. However, the magnitude of this significance is nil for 19 out
of 30 the items, and small for the other 11. Moreover, no important dissimilarities were found in
comparing both samples’ estimates in terms of the behaviours’ prevalence and their determinants.
Finally, the measurement invariance analyses on the index of adaptation to the Lyme disease show
a similar structure of the index for both samples. In conclusion, although the web and telephone
samples are different in some respects, their respondents tend to have similar behaviors of
adaptation to the disease.

                                                 iii
Table des matières

Résumé ......................................................................................................................................................... ii
Abstract ........................................................................................................................................................ iii
Liste des tableaux.......................................................................................................................................... v
Liste des sigles .............................................................................................................................................. vi
Remerciements ........................................................................................................................................... vii
Introduction .................................................................................................................................................. 1
Contexte théorique de l’étude...................................................................................................................... 6
   Le mode de collecte de données web ...................................................................................................... 6
   Le mode de collecte de données par téléphone ...................................................................................... 8
   Recension des écrits................................................................................................................................ 10
Chapitre 1: Telephone versus web panel national survey for monitoring adoption of preventive
behaviors to climate change in population: a case study of Lyme disease in Quebec, Canada ................. 15
   1.1         Abstract: ...................................................................................................................................... 16
   1.2         Background ................................................................................................................................. 17
   1.3         Methods ...................................................................................................................................... 20
   1.4         Results ......................................................................................................................................... 24
   1.5         Discussion.................................................................................................................................... 29
   1.6         Conclusions ................................................................................................................................. 32
   1.7 References ........................................................................................................................................ 33
   1.8 Tables ................................................................................................................................................ 39
   1.9 Additional files .................................................................................................................................. 48
Discussion.................................................................................................................................................... 55
   2.1 Synthèse des résultats obtenus ........................................................................................................ 55
   2.2 Interprétation sur les résultats obtenus ........................................................................................... 57
   2.3 Forces et limites de l’étude ............................................................................................................... 59
   2.4 Conclusion ......................................................................................................................................... 59
Références .................................................................................................................................................. 62

                                                                                 iv
Liste des tableaux

Table 1. Description of the variables measured ......................................................................................... 39
Table 2. Threscholds for the interpretation of Cohen's and Cramer's V .................................................... 42
Table 3. Item Non-Responses for the Sociodemographic Variables in the Web and Telephone Surveys 42
Table 4. Comparison of the Telephone and Web Survey Data with the Census Data Regarding
Sociodemographic Variables ...................................................................................................................... 43
Table 5. Comparison of weighted item responses from the Web and Telephone Surveys on Lyme Disease
Exposure ..................................................................................................................................................... 44
Table 6. Comparison of the Weighted Mean of the Web Survey with the Telephone Survey on Lyme-
Disease-Related Variables .......................................................................................................................... 45
Table 7. Measurement Invariance of the Index of Adaptation ................................................................... 47
Table 8. Quotas originally provided to the polling firm............................................................................. 48
Table 9. Samples’ actual numbers per region ............................................................................................ 49
Table 10. Socio-demographic characteristics: comparing weighted web/phone samples and census ....... 50
Table 11. Comparison of the unweighted item non-responses of the Web and Telephone Surveys on
Lyme Disease Exposure .............................................................................................................................. 52

                                                                               v
Liste des sigles

OQACC          Observatoire québécois d’adaptation aux changements climatiques

HTML           Hypertext markup language

RDD            Random digit dialing

ANOVA          Analysis of variance

PCE            Procedure de concordance exacte

LDPB           Lyme disease prevention behavior

ESS            Effective sample size

CFI            Comparative fit index

TLI            Tucker-Lewis index

RMSEA          Root mean squared error of approximation

FET            Fisher’s exact test

                                         vi
Remerciements

Je veux tout d’abord témoigner toute ma reconnaissance à mon Dieu Le grand Yahweh pour qui
et par qui j’ai eu la capacité de rentrer dans ce projet de maîtrise et de l’achever. Merci Seigneur
de tout mon cœur. Tu as rendu l’impossible possible encore une fois dans ma vie.

Je veux ensuite dire un énorme merci à Pierre Valois mon directeur de recherche, de m’avoir donné
l’opportunité de rentrer dans ce projet. Merci du fond du cœur de m’avoir confié une telle tâche.
Tes encouragements et ta patience m’ont été d’un grand réconfort, et tes conseils judicieux m’ont
été d’une aide précieuse.

Je tiens à exprimer ma reconnaissance envers M. Claude Bélisle qui m’a référé à mon directeur de
recherche Pierre, pour ce projet de maîtrise. Cette belle aventure a commencé grâce à la foi que
vous avez eu en moi et ça je ne l’oublierai jamais.

À toi ma chère et tendre maman Marie-Josée Ngambo, Je dis merci. Pour les petites tapes dans le
dos dans mes temps de procrastination, pour tes encouragements et pour le fait d’avoir cru en moi
jusqu’au bout. Je ne pense pas que j’y serais arrivée sans toi.

À mon cher papa Jean-Baptiste Ngambo, à mes sœurs adorées Gabrielle Ngambo et Kelly Garvin,
à mon oncle Marcel Meli et ma tante Yvonne Meli, merci pour le soutien non négligeable que vous
avez été tout au long du cheminement.

Enfin, à toute l’équipe de l’OQACC, merci pour votre aide et votre soutien. Merci pour la belle
atmosphère de travail et votre bonne humeur. Que Dieu vous bénisse tous.

                                                 vii
Introduction

Contexte
       Dans les huit dernières décennies sont apparus les quatre principaux modes de
collecte de données utilisés à l’heure actuelle. Des années 1940, marquant la recherche par
sondage par l’expansion des modes face à face et par voie postale, aux années 1970, qui ont
connu la création et l’essor du mode par téléphone et à l’apparition 20 ans plus tard du mode
web, chaque mode a connu sa période de popularité (Couper & Miller, 2008). Cette évolution
constante et cette transition en popularité d’un mode à l’autre de la recherche par sondage
s’explique en grande partie par une tendance naturelle à suivre la société constamment en
mouvement, notamment au niveau technologique.

       Le mode téléphone en son temps se démarquait des autres, particulièrement à cause
de sa rapidité d’exécution, sachant qu’il était équivalent au mode face à face en termes de
qualité des données (Couper, 2011). Le mode web venu par la suite a en très peu de temps
impacté la recherche par sondage d’une façon profonde (Couper & Miller, 2008). L’attention
méthodologique qu’il a reçue jusqu’à présent a surpassé celle qu’ont eue les autres modes en
leur temps.

       Ainsi, le mode par téléphone qui était encore récemment le plus utilisé parmi les
modes traditionnels se voit de plus en plus mis à l’écart en faveur du mode web (Tourangeau,
Conrad & Couper, 2013). Ceci s’explique par le fait que le mode web se démarque beaucoup
par la rapidité de son processus de collecte et d’envoie des résultats et par son coût
significativement plus bas que celui des modes traditionnels face à face, voie postale et
téléphone (Bethlehem, 2008; Braunsberger, Wybenga & Gates, 2007; Fan & Yan, 2010;
PewResearchCenter, May 2015; Wright, 2005). Ce sont des avantages importants qui
influencent souvent les enquêtes par sondage dans le choix du mode de collecte à favoriser.

Problème posé
       Dans le processus de réalisation d’une enquête par sondage, une des principales
étapes de démarrage consiste en la sélection d’un mode de collecte de données approprié.
C’est une étape fondamentale qui influencera la qualité des données. Concernant le mode
web, est-il comparable aux modes traditionnels quant à la qualité des données qu’il livre?

                                             1
Bien que populaire en recherche par sondage, le mode web connaissait encore il y a 10 ans
une certaine résistance due à des incertitudes concernant la qualité de ses données. Cette
méfiance s’explique par les différences qui ont été observées entre le mode web et les modes
traditionnels (Chang & Krosnick, 2009; Solomon, 2000), différences qui peuvent se traduire
en avantages et inconvénients du mode web.

       Le mode web recèle d’attrayants avantages. En plus de son coût significativement
plus bas et de sa rapidité opérationnelle, on peut relever l’absence du biais de l’interviewer
qui est parfois dû à des malentendus entre ce dernier et le répondant, à de mauvaises habitudes
chez l’interviewer, etc. (Chang & Krosnick, 2009; Tourangeau et al., 2013). Par ailleurs, avec
le mode web, le répondant peut compléter un questionnaire à son rythme. Il a la possibilité
de relire une question qu’il n’a pas comprise, prendre une pause ou sauter une question et y
revenir plus tard. Ainsi, la pression de devoir répondre à une question dans un court laps de
temps est moins élevée chez le répondant du mode web (Chang & Krosnick, 2009;
PewResearchCenter, May 2015). De plus, il est bien connu que la désirabilité sociale qui
affecte souvent les enquêtes ayant recours à un intervieweur est moindre chez les enquêtes
utilisant un questionnaire auto-administré (Gingras & Belleau, 2015; Sarracino, Riillo &
Mikucka, 2017; Stephenson & Crête, 2010; Tourangeau et al., 2013). Ceci s’explique par la
volonté des répondants interviewés de présenter une image socialement acceptable d’eux-
mêmes devant leur interlocuteur, contrairement aux personnes qui répondent à un
questionnaire auto-administré qui ont un plus grand sentiment de confidentialité. Ces derniers
ont alors tendance à être plus ouverts et honnêtes dans leurs réponses (Fricker, Galesic,
Tourangeau, & Yan, 2005; Zhang, Kuchinke, Woud, Velten, & Margraf, 2017).

       La méthode de sondage web présente aussi des inconvénients non négligeables,
comme son taux de réponse généralement plus faible que celle par téléphone (Roster, Rogers,
Albaum, & Klein, 2004; Tourangeau et al., 2013), ou encore la tendance des internautes à
avoir un profil différent des autres membres de la population. On constate que les premiers
sont généralement moins âgés, plus éduqués, avec un revenu plus élevé (Gauvin, 2012; Le
Cefrio, 2015; Porter & Donthu, 2006). Ce constat soulève une certaine inquiétude quant au
niveau de la représentativité des échantillons collectés en mode web par rapport à la
population. De plus l’absence de l’intervieweur peut être problématique lorsque le répondant

                                              2
à besoin de plus d’éclairage sur la question posée. L’influence positive que peut apporter un
intervieweur par son intonation et son intérêt pour le sujet d’enquête est manquante. Enfin,
un répondant ayant du mal à lire ou à écrire sera difficilement inclus au sondage web (Chang
& Krosnick, 2009). Ceci est un inconvénient important à considérer lorsqu’on sait que 20%
de la population de la province du Québec de 16 à 65 ans est estimé comme n’étant que de
niveau 1 ou moins en 2012 (5 étant le plus haut niveau) en compréhension de texte et
numératie (Desrosiers, Nanhou, & Ducharme, 2015).

       On a relevé que les biais dus à la qualité des données (tels que des taux de réponse
bas et les biais de couverture) des modes de collecte traditionnels sont une source
d’inquiétude grandissante, plus spécifiquement celui du téléphone (Breton, Cutler, Lachance,
& Mierke-Zatwarnicki, 2017; Sala & Lillini, 2015; Sarracino et al., 2017). Ceci peut
s’expliquer notamment par l’arrivée de nouveaux moyens tels que des envois massifs de
courrier et les activités de télémarketing souvent accablantes, ainsi que la possibilité de
filtrage des appels à l’aide d’écrans d’affichage. Ces nouveaux éléments réduisent la capacité
à persuader les répondants de participer aux enquêtes (Braunsberger et al., 2007; Grandjean,
Nelson, & Taylor, 2009). D’un autre côté, on observe une expansion sûre et constante
d’internet année après année, qui très possiblement mènera à l’amélioration de la
représentativité des échantillons web (Institut de la Statistique du Québec, 2013; Poushter,
2016; Sterrett, Malato, Benz, Tompson, & English, 2017).

       Bien qu’il existe dans la littérature un certain nombre d’études de comparaison entre
le mode web et les modes traditionnels, l’évolution continuelle de la société notamment au
plan technologique influence inévitablement la qualité des données. L’actualité des
changements observés est ce qui rend pertinent le problème posé ici.

Buts et objectifs
       L’étude rapportée ici tente de fournir une réponse à la question de savoir s’il existe
une différence entre le mode web et le mode par téléphone du point de vue des résultats
observés et de la représentativité de l’échantillon. Nous avons choisi ces deux modes à cause
de leur popularité au sein des firmes de sondage québécoises. Il s’ensuit donc que l’étude a
été réalisée dans la province du Québec. Les données ont été collectées lors d’une étude sur

                                              3
les comportements d’adaptation à la maladie de Lyme (Valois et al., s. d.), réalisée par
l’OQACC (Observatoire Québécois d’adaptation aux changements climatiques).

Afin de répondre au problème posé, nous examinons en premier la représentativité des deux
échantillons web et téléphone par rapport à la population du Québec du point de vue de
certaines caractéristiques sociodémographiques, soit l’âge, le sexe, le plus haut niveau
d’éducation atteint, la taille du ménage, la présence ou non d’enfants dans le ménage et le
revenu annuel du ménage. L’évaluation de la représentativité de nos échantillons se base sur
les résultats du recensement de 2016. Ensuite nous comparons les échantillons du point de
vue des prévalences estimées des comportements d’adaptation à la maladie de Lyme et
d’autres variables théoriquement associées. Enfin, nous testons l’invariance métrique d’un
indice d’adaptation à la maladie entre le sondage web est le sondage par téléphone. Le but
du test de l’invariance est de déterminer si les résultats de la mesure de l’indice varient selon
le mode de collecte de données. Il est souhaité que les résultats soutiennent l’invariance de
l’indice. Dans le cas contraire, les décisions des services de santé sur les mesures de
protection à promouvoir ou renforcer pour se protéger des piqûres de tiques varieraient selon
le mode de collecte de données utilisé. Les analyses répondant à ces objectifs sont effectuées
sur les données non-pondérées, et reprises sur les données pondérées afin de pallier un
éventuel problème de non-représentativité.

Ampleur de l’étude pour le domaine de recherche et le champ de mesure et évaluation
Apport au domaine de recherche

       Bien que des études similaires aient déjà été menées sur le sujet (Chang & Krosnick,
2009; Fricker et al., 2005; Nantel & Lafrance, 2006; PewResearchCenter, 2015; Roster et al.,
2004; Xing & Handy, 2014), il n’existe aucun consensus permettant de favoriser un mode
par rapport à l’autre. Par ailleurs, avec la croissance constante du taux d’utilisation d’internet
et la diminution constante du nombre de familles équipée d’un téléphone fixe (Link,
Battaglia, Frankel, Osborn & Mokdad, 2007; Mohorko, De Leeuw & Hox, 2013; Nantel &
Lafrance, 2006; Vicente, Reis & Santos, 2009), il est important de maintenir un suivi de
l’évolution de la qualité des données provenant du mode web. Des études ont démontré une
diminution dans le temps du nombre de familles équippées d’une ligne fixe en faveur de
l’usage exclusif de cellulaires. Ceci pourrait donner lieu à des échantillons non probabilistes

                                                4
et engendrer des biais compromettant ainsi la validité des résultats. C’est en prennant en
compte ces changements continuels, tant au niveau du mode web que celui par téléphone,
que l’on peut juger de l’importance d’une étude supplémentaire sur ce sujet pour le domaine
de recherche.

Apport au champ de mesure et évaluation

       En mesure et évaluation, la collecte des données est une des étapes nécessaires à la
mesure et l’évaluation d’un outil donné. Le mode de collecte utilisé aura une influence sur la
qualité des données. La mesure d’un construit peut être tout à fait fiable en temps normal,
mais donner des résultats différents selon le contexte dans lequel il a été administré. Par
exemple, le biais de désirabilité sociale peut affecter les résultats, selon que le questionnaire
a été auto-administré ou que le sujet a été assisté par un interviewer (Gingras & Belleau,
2015; Sarracino et al., 2017; Stephenson & Crête, 2010; Tourangeau et al., 2013). Dans un
tel scénario, le test en lui-même est fidèle, mais les résultats divergeront du fait du mode de
collecte employé.

       Une étude de comparaison des modes web et téléphone permet de déterminer si en
plus de l’avantage que le sondage web offre en termes de temps et de coût, il fournit
également des données favorisant des résultats généralisables à la population étudiée.

Structure du mémoire

       Le mémoire est structuré de la manière suivante : Une première partie porte sur le
contexte théorique de l’étude. Elle est composée d’une présentation du mode de collecte web,
puis du mode de collecte par téléphone et enfin d’une recension des écrits sur des résultats
d’études similaires à celle-ci et sur différents outils de comparaison des modes de collecte.
La deuxième partie contient l’article dont cette étude a fait l’objet. Finalement une troisième
partie contient la discussion dans laquelle est fait un bilan des résultats observés selon les
objectifs préalablement fixés, ainsi qu’un état des forces et limites de l’étude, de son
implication, et de suggestions de recherches futures.

                                               5
Contexte théorique de l’étude

Le mode de collecte de données web

        Le mode web est une méthode de collecte des données par internet, selon laquelle les
questionnaires sont remplis sur des pages en langage hypertexte (HTML) du « World Wide
Web ». Les sujets ciblés sont généralement contactés et invités à participer au sondage soit
dans un courriel incluant le lien vers la page web du questionnaire, soit par une lettre à la
poste contenant l’adresse du site contenant le questionnaire, ou encore lors d’une visite de
ces derniers sur un site internet.

        Le moyen de contact de sujets potentiels dépend du type de sondage web qu’on veut
utiliser. Les types de sondages web peuvent être regroupés en deux catégories majeures
(Couper, 2000; Tourangeau et al., 2013) : les sondages web probabilistes et les sondages web
non probabilistes. Le premier groupe se distingue du deuxième en ce qu’il permet que tous
les membres de la population aient la même chance d’être recrutés dans l’échantillon.

Selon Couper (2000), la catégorie des sondages web probabilistes inclut ceux dont :

    -   l’échantillon est constitué de visiteurs d’un site internet spécifique, aléatoirement
        recrutés à l’aide d’une fenêtre d’invitation pop-up;
    -   les participants appartiennent à une liste d’individus représentant une population bien
        définie recrutés par courriel ou par la poste (p. ex. les étudiants d’une université);
    -   l’option de compléter le questionnaire par le web est offerte aux membres de
        l’échantillon lors d’un premier contact par un autre moyen (p. ex. par téléphone, par
        la poste, etc.);
    -   l’échantillon fait partie d’un panel constitué exclusivement de membres de la
        population des internautes contactés initialement par une méthode de sondage
        probabiliste telle que la composition aléatoire ou « random digit dialing » (RDD) en
        anglais. Il est probabiliste dans la mesure où la population visée est uniquement
        celle des usagers d’internet;
    -   l’échantillon fait partie d’un panel probabiliste représentatif de la population
        complète (internautes et non-internautes). En premier lieu, le panel est constitué à

                                                6
l’aide d’une méthode probabiliste sans internet (p. ex. complétement aléatoire).
       L’échantillon qui en ressort est alors constitué de personnes ayant accès ou pas au
       web. Lors du sondage, l’équipement et les outils nécessaires à une connexion internet
       sont fournis aux répondants potentiels en échange de leur participation.

Toujours selon Couper (2000), les sondages non-probabilistes incluent ceux où les
répondants :

   -   sont un groupe de volontaires, généralement visiteurs d’un site internet, auxquels on
       demande de participer au sondage (p. ex. sondage ayant valeur de divertissement).
       Les résultats de ces sondages sont sans valeur scientifique réelle;
   -   sont recrutés par invitations ouvertes sur des portails ou sites web fréquemment
       visités. Ils sont similaires aux enquêtes pour divertissement, mais dans ce contexte,
       les résultats se veulent scientifiquement valides;

   -   Prennent part à plusieurs sondages en tant que membres recrutés généralement sur
       des sites internet populaires.

   Réaliser un sondage web probabiliste représente un défi majeur. En effet, il est très
souvent difficile, voire même impossible d’avoir accès à une proportion suffisamment élevée
de la population de référence. Sachant que le moyen de contact et de recrutement
généralement utilisé lors des sondages web est celui par courriel, il faudrait idéalement avoir
accès aux adresses électroniques d’une grande proportion de la population à étudier, ce qui
est souvent impossible. C’est d’ailleurs pour cela qu’il n’existe pas encore de méthode
standard d’échantillonnage web (Tourangeau et al., 2013),d’où l’intervention des sondages
web non probabiliste comme solution alternative.

   Les sondages web non probabilistes représentent toujours un certain risque dans la
mesure où le manque de représentativité de l’échantillon peut biaiser les estimations que l’on
veut faire sur la population de référence. Cependant, si certaines conditions sont remplies,
les échantillons non-probabilistes peuvent apporter des résultats aussi probants que les
échantillons probabilistes. Selon Yeager et al., (2011) ces conditions sont rencontrées, par
exemples :

                                              7
-   si le facteur qui détermine la présence ou l’absence d’un membre dans l’échantillon
       n’est pas corrélé avec la variable d’intérêt. Par exemple, lors de l’étude sur
       l’adaptation de la population à la maladie de Lyme, sélectionner les centres de plein-
       air comme bassin de collecte des échantillons poserait un biais. En effet, les individus
       fréquentant ces centres sont naturellement plus sensibilisés à la maladie que d’autres.
       Dans ce cas particulier, le facteur déterminant la présence des sujets dans l’échantillon
       (centre de plein-air) est corrélé à la variable d’intérêt (variable d’adaptation à la
       maladie);
   -   la méthode des quotas est utilisée. Cette méthode peut être utilisée avant ou après la
       collecte des données. On regroupe la population en classes dont les effectifs réels sont
       connus. Ces derniers sont multipliés par le taux de sondage (portion de la population
       faisant partie de l’échantillon), ce qui nous donne les quotas à respecter (Desabie,
       1963). Il s’agit ici d’améliorer la représentativité de l’échantillon en faisant des
       groupements d’individus selon une ou des variables de contrôle (p. ex. âge, sexe,
       revenu, région). Une variable de contrôle doit comporter les qualités suivantes : avoir
       une distribution statistique connue dans la population, être facile à observer sur le
       terrain et ne pas comporter de sérieux risques d’erreur, être étroitement corrélée à la
       variable d’intérêt.

Le mode de collecte de données par téléphone

       La collecte des données par téléphone demeure l’un des modes les plus prisés,
notamment à cause de la simplicité relative avec laquelle il permet l’obtention d’échantillons
probabilistes de la population générale (Vehovar, Slavec, Berzelac & Gideon, 2012). La
collecte de données par téléphone peut se faire d’une des deux manières suivantes : Par
composition aléatoire (RDD en anglais) ou en se basant sur un annuaire téléphonique.

Collecte basée sur un annuaire téléphonique

       Cette méthode est la plus adéquate lorsqu’une liste téléphonique précise de la
population à l’étude est disponible. Les numéros seront alors sélectionnés aléatoirement
parmi ceux de la liste (Lavrakas, 1987).

Collecte par RDD ou composition aléatoire

                                              8
Créée par Couper (1964), cette méthode augmente les chances d’obtenir un sondage
téléphonique probabiliste en réduisant le biais potentiellement créé lorsque des numéros de
téléphones sont non répertoriés dans un annuaire téléphonique. En effet, la méthode RDD ne
se réfère pas à une liste préalablement faite. Elle consiste à générer aléatoirement tous les
numéros de téléphones qui pourraient possiblement se retrouver dans le cadre
d’échantillonnage voulu. Durant ce processus, on dresse d’abord la liste exhaustive de tous
les indicatifs régionaux de la zone géographique de la population qu’on veut étudier. On
génère ensuite tous les numéros qui peuvent en ressortir. L’information sur la banque des
lignes vacantes (celles qui ne sont pas octroyées parmi les numéros générés en RDD) peut
être pourvue par la compagnie téléphonique afin de supprimer les numéros invalides. Le
processus permettant d’aboutir à un sondage RDD peut s’avérer lourd en termes de temps et
de coûts. Avant de s’y investir, il faut considérer l’étendue des zones géographiques à couvrir,
la disponibilité de l’information sur les banques des lignes vacantes et le pays dans lequel est
effectué le sondage. En effet, la complexité du système par lequel les lignes téléphoniques
sont créées est parfois trop élevée dans certains pays pour envisager le recours au RDD
(Vehovar et al., 2012).

       Très souvent, lorsqu’on parle de sondage téléphonique en recherche, on fait référence
aux lignes téléphoniques de maison. Cependant depuis les années 2000, la téléphonie mobile
s’est suffisamment étendue pour être considéré comme un mode de collecte adéquat
(Vehovar et al., 2012). Inclure ce nouveau mode dans un plan de sondage n’est toutefois pas
évident à cause non seulement des coûts qu’il engendre (plus onéreux que le téléphone fixe),
mais aussi des biais qu’il peut occasionner notamment à cause de la non-réponse, du manque
de représentativité, de la difficulté à distinguer les lignes fixes et mobiles, des indicatifs
régionaux ne prouvant en rien la localisation géographique des sujets jusqu’au type
d’appareil téléphonique utilisé (Brick, Edwards & Lee, 2007; Lavrakas et al., 2007). En
considérant tous ces éléments et en pourvoyant à une approche méthodologique adaptée, il
est toujours possible d’éviter ou de contourner les biais.

       C’est ce que font des compagnies telles que BIP-sondage (la compagnie de sondage
engagée pour ce projet) qui possède trois banques de cellulaires qui lui ont été attribuées par
un fournisseur externe. La première est une liste de RDD pour laquelle on ne peut dire au

                                               9
départ si le cellulaire est actif ou pas. La deuxième est une liste dont les RDD ont été filtrés
et dépouillés des numéros inexistants. La troisième est une liste contenant des ménages sans
ligne téléphonique fixe.

Recension des écrits

Comparaisons des modes de sondage dans la littérature

        Des recherches similaires à la nôtre ont déjà été faites sur le sujet. Différentes
méthodes ont été employées durant le processus de comparaison, et des conclusions variables
ont été établies.

        Dans une étude réalisée par Zhang et al. (2017), 13 questionnaires psychologiques
mesuraient les aspects positifs (p. ex. résilience, santé mentale positive, bonheur subjectif,
autosuffisance) et négatifs (p. ex. pessimisme, état d’anxiété, de stress et de dépression, etc.)
de la santé mentale. Quatre méthodes de collecte de données ont été comparées du point de
vue de ces 13 aspects : (1) le mode par questionnaires en ligne, c’est-à-dire sur le web, (2) le
mode par questionnaires hors-ligne où les sujets répondaient à partir de leurs ordinateurs
personnels ou de leurs écrans de télévision connectés à un logiciel de la compagnie de
sondage par l’intermédiaire d’un dispositif appelé « set-top-box », (3) le mode par téléphone
et (4) le mode face à face. Les différences les plus grandes ont été observées entre les modes
en ligne/hors ligne et celui par téléphone. De plus, l’analyse de l’invariance de la mesure
indique l’absence d’invariance scalaire complète (des explications sur les différents tests
d’invariance sont données dans le paragraphe intitulé « différents outils de comparaison »)
sur l’ensemble des 4 modes pour 4 des 13 facteurs analysés. Ces 4 facteurs sont le sens de la
cohérence, la résilience, le bonheur subjectif et la tradition. Pour ce qui est du sens de la
cohérence, il y avait invariance scalaire complète pour les modes face à face, en ligne et par
téléphone. La résilience a eu de l’invariance pleine pour les échantillons en ligne, hors-ligne
et par téléphone. Concernant le bonheur subjectif on n’a trouvé de l’invariance scalaire
complète qu’entre les modes hors-ligne et téléphone. Finalement, le facteur tradition a montré
de l’invariance scalaire complète entre le mode face à face et hors-ligne, en ligne et hors-
ligne et entre le mode téléphone et hors-ligne.

                                               10
Chang et Krosnick (2009) ont comparé trois échantillons où les participants devaient
répondre à un sondage pour la campagne électorale présidentielle de l’an 2000. Les
échantillons ont été obtenus par trois modes de collecte différents : le mode téléphonique
RDD, le mode internet probabiliste et le mode internet non probabiliste. L’échantillon non
probabiliste était constitué de volontaires qui ont accepté de répondre à l’enquête en retour
d’un montant d’argent. Ils ont découvert entre autres que lors des auto-évaluations
(constituées de prédictions faites par les répondants sur leurs choix de vote, d’une évaluation
des principaux candidats des élections, et d’un ensemble vaste d’attitudes et de croyances des
répondants qui pourraient influencer le choix de vote), les répondants internet donnaient une
description plus précise et détaillée dans leurs réponses que ceux par téléphone. Ceci s’est
manifesté notamment par : une plus grande validité prédictive et convergente mesurée par la
corrélation entre les réponses (à des items déterminants du choix de vote) données lors d’un
sondage pré-électoral et le choix de vote réel transmis dans le sondage post-électoral. Ils ont
également observé, une plus grande fidélité (selon un modèle d’équations structurelles
permettant d’estimer la stabilité d’un construit). Finalement, la désirabilité sociale et le biais
de suffisance - c’est lorsqu’à une question demandant un effort cognitif substantiel, le
répondant préfère donner une réponse qui satisfait ou qui se base sur le statut quo (Krosnick,
1991) - étaient plus faibles chez les échantillons fournis par internet que celui par téléphone.

       Braunsberger et al. (2007) ont comparé la consistance dans le temps du panel web et
de la méthode téléphonique au cours d’une enquête qui incluait l’évaluation de la couverture
de l’assurance maladie en se basant sur 10 critères (p. ex. digne de confiance, bien informée,
reconnu par les médecins). Le contenu du questionnaire était le même pour les deux modes,
et pour chaque mode de sondage, ils ont effectué une première collecte des données à un
temps 1, et une deuxième au temps 2, environ 2 mois plus tard. Ils ont ensuite comparé les
deux modes de collecte de données du point de vue de leur capacité à demeurer fidèles dans
le temps. On voulait donc savoir si le passage du temps affectait la qualité d’un mode de
collecte plus que l’autre. Pour ce faire, on a d’abord effectué un test d’ANOVA afin de
comparer sur chacun des 10 critères l’échantillon web au temps 1 à celui du temps 2, puis
l’échantillon téléphone du temps 1 à celui du temps 2. Les résultats ont montré une
congruence dans le temps des échantillons par internet, contrairement aux échantillons par
téléphone. En effet, des différences significatives ont été trouvées sur les 10 critères dans le

                                               11
cas du mode par téléphone, tandis que concernant le mode web, un seul critère a abouti à des
résultats significativement différents dans le temps. Sur la base de ces résultats, ils ont conclu
que le mode web peut produire des résultats plus fiables que celui par téléphone. Une enquête
de (Rankin et al., 2008) est également arrivée à des conclusions similaires.

        Bien que des différences significatives aient été observées entre le web et le téléphone
dans plusieurs études, on a relevé d’autres études dont les conclusions indiquaient que les
deux modes peuvent obtenir des résultats similaires. C’est le cas par exemple d’une étude de
Roster et al. (2004) qui ont mesuré la réputation d’une entreprise spécifique dans une région
métropolitaine majeure lors d’un sondage. Le questionnaire a été soumis à deux groupes :
l’un consistait en un échantillon probabiliste collecté par mode téléphonique et le second en
un échantillon tiré d’un panel web. Ils n’ont trouvé aucune différence entre les deux groupes
de leur enquête du point de vue de la prédiction de leurs comportements. Les profils
sociodémographiques ce sont cependant révélées différents d’un mode de sondage à l’autre.

        De façon générale, plusieurs chercheurs sont d’accord sur le fait que le web et le
téléphone présentent des dissimilarités certaines, alors que d’autres sont plus enclin à croire
que les deux modes ne sont pas si différents et peuvent même être complémentaires l’un à
l’autre (Breton et al., 2017; Couper, 2011). Cependant, la réponse à la question : « Lequel
des modes de collecte de données est le plus satisfaisant en termes de représentativité? »,
reste difficile à obtenir. Afin de répondre à cette question, il est d’abord primordial de
déterminer les critères et outils qui permettront de juger de la qualité des données.

Critères et outils de comparaison

        Selon Bowling (2005), chaque mode nécessite des capacités cognitives différentes de
la part des répondants, et varie selon le niveau d’intimité et d’anonymat dont il fait bénéficier
ces derniers, ce qui affecte le processus de réponse aux questions, et par là même, la qualité
des données. Plusieurs méthodes de comparaison permettant de vérifier si les échantillons
sont affectés par l’effet des modes ou de biais et ainsi déterminer le mode de collecte le plus
approprié ont été identifiées la littérature.

        La comparaison des caractéristiques sociodémographiques des échantillons est un
bon début. En d’autres termes, on pourrait comparer l’âge, le sexe, la situation matrimoniale,

                                                12
le salaire, le niveau d’éducation, l’origine etc. (Beck, Yan, et Wang, 2009; Chang et
Krosnick, 2009; Dillman et al., 2009), selon les besoins de l’étude et des données disponibles.
On effectue aussi parfois une comparaison de chaque échantillon avec les données du
recensement dans le but d’évaluer la représentativité des échantillons à la population générale
(Beck, Yan, et Wang, 2009; Chang et Krosnick, 2009; Dillman et al., 2009).

       Ensuite, on peut choisir certaines variables du questionnaire de l’étude et effectuer
des comparaisons de moyennes ou de proportions. Des tests de chi-deux ou de Fisher
pourraient être effectués sur les variables catégorielles (Read & Cressie, 2012), des analyses
de la variance (ANOVA) (Xing et Handy, 2014) ou encore des tests de Student, un cas
particulier de l’ANOVA (Fricker et al., 2005; Roster et al., 2004). Dans le cas d’un manque
de représentativité de la part des échantillons, une pondération permet de les ajuster. Les tests
nommés plus haut peuvent alors être reproduits sur les données pondérées. La pondération
peut être faite de différentes façons. Deux exemples proposés de pondération sont : la
pondération basée sur les données de la population externe (Fricker et al., 2005) et la
procédure de concordance exacte (PCE) où le groupe traitement et le groupe contrôle sont
équilibrés. Autrement dit, les groupes traitement et contrôle ont une distribution similaire à
leurs covariances (Sarracino et al., 2017).

       Un autre moyen utilisé pour comparer les modes de sondage est l’analyse de
l’invariance de la mesure. Elle consiste à vérifier si l’association entre le facteur latent et le
score qui lui est attribué ne dépend pas de l’appartenance à un groupe ou à une mesure dans
le temps. L’absence d’invariance est un signe qu’au moins un des modes de sondage
impliqués donne des résultats biaisés au regard du facteur en question. L’invariance de la
mesure repose généralement sur trois principaux tests. D’abord, l’invariance configurale qui
teste l’intégrité de la structure factorielle (Chen, Dai & Gao, 2019; Zhang et al., 2017).
Ensuite, l’invariance métrique qui vérifie que les échantillons répondent aux items du facteur
de la même manière. En d’autres mots, elle vérifie si la corrélation entre les items et leur
construit latent est similaire d’un groupe à l’autre (Sass & Schmitt, 2013; Steenkamp &
Baumgartner, 1998). Enfin, l’invariance scalaire qui vérifie que les individus ayant les
mêmes scores aux items ont également le même score au niveau du facteur indépendamment
du groupe auquel ils appartiennent (Zhang et al., 2017). Ces tests se font dans l’ordre et

                                               13
l’aboutissement du dernier garantit que les deux autres ont obtenu un résultat positif.
L’établissement de l’invariance métrique et scalaire permettent de conclure qu’il y a
invariance de la mesure (Sass & Schmitt, 2013). À chaque test, l’invariance peut être
considérée nulle (le modèle testé pour invariance est inadéquat avec ou sans modification),
partielle (le modèle testé est adéquat seulement après modifications), complète (le modèle
testé est adéquat sans modification préalable) (Putnick & Bornstein, 2016). Il existe d’autres
tests complémentaires d’invariance tels que : l’invariance stricte qui permet de vérifier si les
effets résiduels (unicité) des items sont les mêmes pour tous les groupes comparés;
l’invariance de la moyenne latente et l’invariance de la variance latente qui vérifient
respectivement l’équivalence de la moyenne et de la variance du score estimé du facteur d’un
échantillon à l’autre (Steenkamp & Baumgartner, 1998).

       Finalement, selon Dillman et al. (2009), le taux de réponse globale et les taux de
réponse par question présentent également un certain attrait pour la comparaison
d’échantillons. D’autres indicateurs tels que le taux de réponse sur les variables
sociodémographiques comparées aux données du recensement, les coefficients des
estimations de variation, les tests de différence statistique entre le taux de répondants et de
non-répondants par région peuvent être utilisés dans le processus de comparaison des modes
de collecte de données (Bélanger, Gosselin, Valois, Abdous, et Morin 2013). Les taux de
réponse doivent cependant être utilisés avec précaution. En effet, seuls, ils ne suffisent pas à
émettre une conclusion en ce qui concerne la qualité des estimations faites sur les données
d’un échantillon (Bethlehem et al., 2008).

       Les outils mentionnés ci-dessus sont les plus utilisés dans la littérature. Leur
pertinence et leur fiabilité justifient leur utilisation courante dans des études de comparaison
des modes de collecte. Notre étude n’en a pas fait exception. Chacun de ces outils de
comparaison y ont été insérés.

                                              14
Vous pouvez aussi lire