Règles et recommandations pour l'utilisation de SPSS - Jean-François Bickel Statistique II - SP08

La page est créée Fabrice Paul
 
CONTINUER À LIRE
Règles et recommandations pour l'utilisation de SPSS - Jean-François Bickel Statistique II - SP08
Règles et recommandations
 pour l’utilisation de SPSS
      Jean-François Bickel
      Statistique II – SP08

                              1
Règles et recommandations pour l'utilisation de SPSS - Jean-François Bickel Statistique II - SP08
Une règle d’or: documenter!

¾Utiliser SPSS implique très rapidement
 l’accumulation d’une multitude
 d’opérations, de variables, de résultats :
 créer des variables; les recoder; analyser
 une variable de plusieurs manières
 différentes; complexifier progressivement
 une analyse en prenant en compte des
 variables supplémentaires, etc.

                                              2
¾Pour s’y retrouver, il faut garder des traces
 de ce que l’on fait :
  ƒ sauvegarder les fichiers de résultats
    (outputs; extension .spo) ou/et les
    imprimer (en les classant)
  ƒ sauvegarder les données « travaillées »
    (variables recodées, nouvelles
    variables, etc.) dans un fichier de
    données (extension .sav) différent du
    fichier de données brutes

                                             3
¾Il est aussi conseillé d’ajouter des
 commentaires (qui peuvent être brefs)
 décrivant ce que l’on fait et/ou le résultat
 de ce que l’on fait
¾Documenter est non seulement utile pour
 le déroulement de son propre travail, mais
 aussi pour en justifier le résultat vis-à-vis
 d’autrui
¾C’est un support dans les cas où il faut
 faire mémoire de ce qui a été fait
                                                 4
Un conseil:
       travailler avec la syntaxe
¾De manière usuelle, on apprend SPSS et
 on travaille avec en utilisant son interface
 graphique (menus déroulants, fenêtres,
 etc.)
¾De même, durant ce cours, toutes les
 opérations (ou presque) pourront être
 faites au moyen de l’interface graphique
 de SPSS

                                                5
¾Cela étant, tout ce que nous demandons
 de faire à SPSS via l’interface graphique
 est « traduit » en instructions qui sont
 ensuite exécutées
¾Ces instructions pour être comprises et
 exécutées par SPSS utilisent un langage
 propre au logiciel, avec ses mots-clés et
 ses règles

                                             6
¾En d’autres termes, pour « commander »
 à SPSS nous utilisons une certaine
 syntaxe
¾L’idée est dès lors de s’appuyer plus
 directement sur la syntaxe elle-même
 (et non uniquement sur l’interface
 graphique
¾Cette idée peut se concrétiser à trois
 niveaux

                                          7
1. En tant que règle : que s’affichent dans
   la fenêtre résultats (outputs), les
   instructions données à SPSS
  ƒ C’est un moyen de garder trace de ce
      que l’on fait avec SPSS :
      permet de regrouper la commande
      générant une certaine analyse et le
      résultat de la même analyse

                                              8
2. A un deuxième niveau, également très
   utile et donc fortement recommandé :
   rassembler dans un fichier ad hoc appelé
   fichier syntaxe (extension .sps) les
   instructions données à SPSS
  ƒ Ces fichiers syntaxes peuvent être
      sauvegardés et ainsi on garde
      mémoire des instructions données à
      SPSS

                                          9
3. Enfin, à titre de conseil : travailler
   directement en mode syntaxe
  ƒ Du fait que les fichiers syntaxe
     peuvent être sauvegardés, on peut les
     réutiliser à une autre occasion pour
     répéter des opérations, soit
     exactement identiques, soit similaires
     (par exemple, pour un même type
     d’analyse, on change simplement le
     nom des variables impliquées)

                                          10
ƒ Cette manière de faire peut permettre
  de gagner du temps, et parfois même
  beaucoup de temps
ƒ De plus, certaines opérations ou options
  ne peuvent tout simplement pas être
  réalisées via l’interface graphique de
  SPSS

                                         11
ƒ Ceux qui apprécient un mode de
  raisonnement analytique préfèrent
  souvent avoir recours à l’écriture de
  syntaxe
ƒ Travailler à l’aide de fichiers de syntaxe
  revient à utiliser un langage plus proche
  du procédé statistique
ƒ En cela, une telle manière de faire peut
  avoir un effet pédagogique en faisant
  mieux « voir » ce que l’on fait

                                           12
Comment faire
¾En référence aux points 1 et 2, modifier
 deux options de SPSS
  ƒ afin que les instructions données à
    SPSS d’effectuer telle ou telle opération
    s’inscrivent dans la fenêtre « résultats »
    (output) de SPSS (cf. point 1 ci-dessus)
  ƒ afin qu’au démarrage de SPSS, une
    fenêtre « syntaxe » s’ouvre
    automatiquement
                                             13
1. Pour cela, aller dans le menu
   Edition
     Options...
2. Sur l’écran qui apparaît, choisir la
   rubrique Généralités et cocher la case
   Ouvrir la fenêtre de syntaxe au
   démarrage
3. Puis dans la rubrique Editeurs de
   résultats, cocher la case Afficher
   syntaxe
4. Cliquer sur Appliquer, puis Ok
                                            14
15
16
17
¾Rien de plus est nécessaire pour appliquer
 la règle du point 1 !

¾Pour illustrer les points 2 et 3, procédons à
 un exemple d’analyse

                                            18
¾Nous nous appuierons sur un extrait du
 fichier de données de l’enquête menée en
 1994 par le Centre interfacultaire de
 gérontologie de l’Université de Genève
 auprès d’un échantillon de la population
 âgée de 60 ans et plus résidant dans le
 canton de Genève et dans le Valais
 central (N=2101)
¾L’échantillon est stratifié par canton, sexe
 et classes d’âges quinquennales
                                            19
Référence : C. Lalive d’Epinay, J.-F. Bickel, C.
Maystre et N. Vollenwyder, Vieillesse au fil du
temps. Une révolution tranquille, Lausanne,
Réalités Sociales, 2000

¾Les variables retenues ici sont :
  ƒ le numéro d’identification de la personne
    interrogée (variable icode)
  ƒ le canton de résidence : 0=Valais
    central ; 1=Genève
  ƒ le sexe : 0=hommes ; 1=femmes

                                                   20
ƒ l’âge (en années)
  ƒ l’état de santé tel qu’évalué par la
    personne, variant de 1 « très mauvais »
    à 5 « très bon »
  ƒ le coefficient de pondération (pour
    rétablir la structure de la population
    « mise à mal » par la stratification : idée
    de représentativité)
¾L’image suivante représente les 25
 premiers individus de la base de données

                                              21
22
¾ Commençons, via l’interface graphique,
   par demander une description de la
   distribution des variables canton, sexe et
   santé auto-évaluée
1. Pour cela, aller dans le menu
   Analyse
     Statistique descriptive
           Effectifs (Frequencies)

                                            23
24
2. Dans la fenêtre qui apparaît,
   sélectionner les trois variables
   concernées
3. Puis cliquer sur statistiques et cocher
   les cases moyenne, médiane, écart
   type, asymétrie, aplatissement
4. Cliquer sur Poursuivre pour revenir
   dans la fenêtre principale

                                             25
26
27
5. De retour dans la fenêtre principale,
   cliquer sur Coller
   (plutôt que sur OK qui est la manière
   habituelle de procéder)
6. Cela a pour conséquence que
   l’instruction donnée à SPSS va être
   écrite dans la fenêtre syntaxe

                                           28
29
¾ Remarque : toutes les instructions
   commencent par un mot clé qui donne
   son nom à l’opération, ici Frequencies;
   celui-ci est suivi d’un certain nombre
   d’indications, certaines obligatoires,
   d’autres optionnelles; enfin toutes les
   instructions se terminent par un point
7. Pour exécuter l’instruction, marquer
   celle-ci à l’aide de la souris, puis cliquer
   sur la flèche Î dans la barre d’outil
                                                  30
31
¾Dans le cliché suivant, remarquons que :
 – La ligne de commande s’est inscrite dans
   la fenêtre Résultats (Outputs)
 – Directement à la suite, sont affichés les
   résultats de l’analyse

                                           32
33
¾Observons tout d’abord dans le tableau
 « Statistiques » que l’effectif total (N
 valide) est de 1805 pour la variable santé
 auto-évaluée, contre 2101 pour les deux
 autres variables
¾Ceci est dû au fait que les personnes
 enquêtées via un proxi (n=263) n’ont bien
 sûr pas été interrogées à ce propos, et
 que 33 personnes interrogées n’ont pas
 répondu
                                              34
35
¾Par ailleurs, on voit que l’échantillon se
 compose d’autant de résidants en Valais
 qu’à Genève, d’autant d’hommes que de
 femmes
¾Cette « étrangeté » est due au caractère
 stratifié de l’échantillon
¾57% évaluent leur état de santé comme
 « bon » ou « très bon » (moyenne par
 rapport à l’échelle de 3.66)

                                              36
¾ Pour l’heure, laissons de côté ces
   chiffres et procédons à une seconde
   analyse :
   un histogramme de la distribution de la
   variable santé auto-évaluée
1. Pour cela, aller dans le menu
   Analyse
    Statistique descriptive
           Explorer (Examine)

                                             37
38
2. Dans la fenêtre qui apparaît,
   sélectionner la variable
3. Cocher la case Graphiques
4. Cliquer sur Diagrammes

                                   39
5. Dans la fenêtre qui apparaît, cocher la
   case Aucun(e) dans la rubrique Boîte à
   moustaches
6. Cocher la case Histogramme dans la
   rubrique Diagramme descriptif
7. Cliquer sur Poursuivre

                                             40
8. Dans la fenêtre principale, comme
   précédemment, cliquer sur Coller

                                       41
¾ Dans la fenêtre syntaxe, la nouvelle
   commande « Examine » (explorer) est
   venu s’inscrire à la suite de l’instruction
   antérieure
9. Comme précédemment, marquer
   l’instruction et lancer l’exécution en
   cliquant sur la flèche Î dans la barre
   d’outil

                                                 42
43
¾Dans la fenêtre Résultats (Outputs), figure
 maintenant l’histogramme demandé

                                           44
¾Revenons au caractère étrange des
 distributions de nos variables
¾Dans notre échantillon,
  – il y a autant de résidants en Valais qu’à
    Genève; or, en réalité, la population du
    canton de Genève est plus nombreuse
    que celle du Valais central
  – il y autant d’hommes que de femmes;
    or, nous le savons bien, la population
    âgée est en réalité à majorité féminine

                                                45
¾Ceci est dû au plan d’échantillonnage de
 l’enquête, qui a reposé sur une
 stratification selon le canton, le sexe et les
 catégories d’âge quinquennales
¾A ce titre, l’échantillon n’est pas
 représentatif de la population
  – les hommes sont surreprésentés dans
    l’échantillon, comme le sont les
    personnes plus âgées

                                              46
¾De plus, ce caractère non représentatif
 peut aussi mettre en doute la validité de la
 description de la santé auto-évaluée
  – comme l’état de santé tend à se
    détériorer avec l’âge, le fait qu’il y ait
    une surreprésentation des personnes
    plus âgées dans l’échantillon pourrait
    conduire à ce que le résultat de notre
    analyse sous-estime le bon état de
    santé dans la population
                                             47
– les travaux dans le domaine s’accordent
  sur le fait que les femmes, si elles vivent
  plus longtemps, ont davantage de
  problèmes de santé que les hommes;
  comme les femmes sont sous-
  représentées dans notre échantillon, le
  résultat de notre analyse pourrait à
  l’inverse surestimer le bon état de santé
  de la population

                                            48
¾Si on veut pouvoir inférer les résultats
 obtenus sur la base de notre échantillon à
 l’univers dont il est issu et être capable de
 poser des affirmations plus générales sur
 la population âgée, il faut corriger la
 structure de l’échantillon
¾Utilisation d’un coefficient de pondération :
 les individus, plutôt que d’être affecté d’un
 même poids dans les analyses, se voient
 attribués des poids différents selon le sexe
 et la catégorie d’âge auxquels ils
 appartiennent
                                             49
¾On peut ainsi rétablir la « vraie » structure
 de la population (univers de référence)
¾Notons aussi que l’enquête de terrain finie,
 on s’est rendu compte d’une
 surreprésentation des personnes âgées en
 institution dans l’échantillon : le coefficient
 de pondération corrige également ce fait
¾Par contre, il ne corrige pas la distribution
 entre cantons : l’addition de
 Genève+Valais ne constitue pas une
 population faisant sens
                                              50
¾ Pour indiquer à SPSS d’utiliser un
   coefficient de pondération (la variable
   doit être créée précédemment)
1. Aller dans le menu
   Données
    Pondérer les observations

                                             51
52
2. Dans la fenêtre qui s’affiche,
   sélectionner la variable de
   pondération (ici variable coefpond)
3. Puis cliquer sur Coller

                                         53
¾ L’instruction s’inscrit dans la fenêtre de
   syntaxe
¾ Répétons les mêmes analyses que
   précédemment, cette fois en tenant
   compte de la pondération
1. Pour cela, il suffit d’aller dans la fenêtre
   de syntaxe, de copier les instructions
   d’analyse déjà utilisées et de les coller à
   la suite de la commande requérant
   l’utilisation de la pondération

                                              54
55
2. Marquer la suite d’instructions et lancer
   l’exécution

                                               56
57
¾Les commandes et les résultats des
 analyses s’inscrivent dans la fenêtre
 Résultats (Outputs)

                                         58
¾L’utilisation du coefficient de pondération
 ne modifie pas la distribution de
 l’échantillon selon le canton
¾Par contre, elle change les proportions
 d’hommes et de femmes : ces dernières
 représentent désormais le 59% de
 l’ensemble

                                               59
60
61
¾La distribution de la santé auto-évaluée se
 modifie peu : le score moyen est à peine
 plus élevé (3.74 contre 3.66); la proportion
 de personnes disant être en « mauvaise »
 ou « très mauvaise » santé est de 7%,
 contre 9% précédemment
¾Cette relative stabilité entre l’avant et
 l’après pondération peut étonner
¾Comment l’expliquer?

                                            62
¾D’un côté, la pondération donne plus de
 poids aux personnes les plus jeunes de
 l’échantillon : effet positif sur l’état de
 santé
¾De l’autre, la pondération donne plus de
 poids aux femmes : effet négatif sur l’état
 de santé

                                               63
¾En plus de ce phénomène de balance
 entre deux effets de sens contraire, l’état
 de santé auto-évalué est plus stable que
 la santé objective :
 processus de régulation psycho-sociale
 (par exemple, comparaison sociale)

                                               64
¾Pour documenter son travail, on peut
 sauvegarder le contenu de la fenêtre
 syntaxe dans un fichier du même type
 (extension .sps)
¾Y compris en ajoutant une brève
 description des procédures suivies, voire
 de ce qui motive ces procédures
¾Les lignes de commentaires doivent
 débuter par un astérisque « * »
¾Ci-après une petite illustration
                                             65
66
Comment exporter les résultats des
    analyses dans un fichier texte?

¾ Pour exporter tout ou partie d’un fichier
   résultats de SPSS
1. Se placer dans la fenêtre résultat
2. Aller dans le menu
   Fichier
     Exporter

                                              67
68
¾ Dans la fenêtre qui s’affiche,
3. Indiquer Sortie document (défaut)
4. Choisir les objets à exporter
   (tout ce qui est dans la fenêtre
   « Résultats » n’est pas forcément utile)
5. Choisir le type de fichier vers lequel
   exporter (ici fichier word/rtf)
6. Choisir l’emplacement et le nom du
   fichier qui sera créé
7. Cliquer sur OK
                                              69
70
Vous pouvez aussi lire