Règles et recommandations pour l'utilisation de SPSS - Jean-François Bickel Statistique II - SP08
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Une règle d’or: documenter! ¾Utiliser SPSS implique très rapidement l’accumulation d’une multitude d’opérations, de variables, de résultats : créer des variables; les recoder; analyser une variable de plusieurs manières différentes; complexifier progressivement une analyse en prenant en compte des variables supplémentaires, etc. 2
¾Pour s’y retrouver, il faut garder des traces de ce que l’on fait : sauvegarder les fichiers de résultats (outputs; extension .spo) ou/et les imprimer (en les classant) sauvegarder les données « travaillées » (variables recodées, nouvelles variables, etc.) dans un fichier de données (extension .sav) différent du fichier de données brutes 3
¾Il est aussi conseillé d’ajouter des commentaires (qui peuvent être brefs) décrivant ce que l’on fait et/ou le résultat de ce que l’on fait ¾Documenter est non seulement utile pour le déroulement de son propre travail, mais aussi pour en justifier le résultat vis-à-vis d’autrui ¾C’est un support dans les cas où il faut faire mémoire de ce qui a été fait 4
Un conseil: travailler avec la syntaxe ¾De manière usuelle, on apprend SPSS et on travaille avec en utilisant son interface graphique (menus déroulants, fenêtres, etc.) ¾De même, durant ce cours, toutes les opérations (ou presque) pourront être faites au moyen de l’interface graphique de SPSS 5
¾Cela étant, tout ce que nous demandons de faire à SPSS via l’interface graphique est « traduit » en instructions qui sont ensuite exécutées ¾Ces instructions pour être comprises et exécutées par SPSS utilisent un langage propre au logiciel, avec ses mots-clés et ses règles 6
¾En d’autres termes, pour « commander » à SPSS nous utilisons une certaine syntaxe ¾L’idée est dès lors de s’appuyer plus directement sur la syntaxe elle-même (et non uniquement sur l’interface graphique ¾Cette idée peut se concrétiser à trois niveaux 7
1. En tant que règle : que s’affichent dans la fenêtre résultats (outputs), les instructions données à SPSS C’est un moyen de garder trace de ce que l’on fait avec SPSS : permet de regrouper la commande générant une certaine analyse et le résultat de la même analyse 8
2. A un deuxième niveau, également très utile et donc fortement recommandé : rassembler dans un fichier ad hoc appelé fichier syntaxe (extension .sps) les instructions données à SPSS Ces fichiers syntaxes peuvent être sauvegardés et ainsi on garde mémoire des instructions données à SPSS 9
3. Enfin, à titre de conseil : travailler directement en mode syntaxe Du fait que les fichiers syntaxe peuvent être sauvegardés, on peut les réutiliser à une autre occasion pour répéter des opérations, soit exactement identiques, soit similaires (par exemple, pour un même type d’analyse, on change simplement le nom des variables impliquées) 10
Cette manière de faire peut permettre de gagner du temps, et parfois même beaucoup de temps De plus, certaines opérations ou options ne peuvent tout simplement pas être réalisées via l’interface graphique de SPSS 11
Ceux qui apprécient un mode de raisonnement analytique préfèrent souvent avoir recours à l’écriture de syntaxe Travailler à l’aide de fichiers de syntaxe revient à utiliser un langage plus proche du procédé statistique En cela, une telle manière de faire peut avoir un effet pédagogique en faisant mieux « voir » ce que l’on fait 12
Comment faire ¾En référence aux points 1 et 2, modifier deux options de SPSS afin que les instructions données à SPSS d’effectuer telle ou telle opération s’inscrivent dans la fenêtre « résultats » (output) de SPSS (cf. point 1 ci-dessus) afin qu’au démarrage de SPSS, une fenêtre « syntaxe » s’ouvre automatiquement 13
1. Pour cela, aller dans le menu Edition Options... 2. Sur l’écran qui apparaît, choisir la rubrique Généralités et cocher la case Ouvrir la fenêtre de syntaxe au démarrage 3. Puis dans la rubrique Editeurs de résultats, cocher la case Afficher syntaxe 4. Cliquer sur Appliquer, puis Ok 14
15
16
17
¾Rien de plus est nécessaire pour appliquer la règle du point 1 ! ¾Pour illustrer les points 2 et 3, procédons à un exemple d’analyse 18
¾Nous nous appuierons sur un extrait du fichier de données de l’enquête menée en 1994 par le Centre interfacultaire de gérontologie de l’Université de Genève auprès d’un échantillon de la population âgée de 60 ans et plus résidant dans le canton de Genève et dans le Valais central (N=2101) ¾L’échantillon est stratifié par canton, sexe et classes d’âges quinquennales 19
Référence : C. Lalive d’Epinay, J.-F. Bickel, C. Maystre et N. Vollenwyder, Vieillesse au fil du temps. Une révolution tranquille, Lausanne, Réalités Sociales, 2000 ¾Les variables retenues ici sont : le numéro d’identification de la personne interrogée (variable icode) le canton de résidence : 0=Valais central ; 1=Genève le sexe : 0=hommes ; 1=femmes 20
l’âge (en années) l’état de santé tel qu’évalué par la personne, variant de 1 « très mauvais » à 5 « très bon » le coefficient de pondération (pour rétablir la structure de la population « mise à mal » par la stratification : idée de représentativité) ¾L’image suivante représente les 25 premiers individus de la base de données 21
22
¾ Commençons, via l’interface graphique, par demander une description de la distribution des variables canton, sexe et santé auto-évaluée 1. Pour cela, aller dans le menu Analyse Statistique descriptive Effectifs (Frequencies) 23
24
2. Dans la fenêtre qui apparaît, sélectionner les trois variables concernées 3. Puis cliquer sur statistiques et cocher les cases moyenne, médiane, écart type, asymétrie, aplatissement 4. Cliquer sur Poursuivre pour revenir dans la fenêtre principale 25
26
27
5. De retour dans la fenêtre principale, cliquer sur Coller (plutôt que sur OK qui est la manière habituelle de procéder) 6. Cela a pour conséquence que l’instruction donnée à SPSS va être écrite dans la fenêtre syntaxe 28
29
¾ Remarque : toutes les instructions commencent par un mot clé qui donne son nom à l’opération, ici Frequencies; celui-ci est suivi d’un certain nombre d’indications, certaines obligatoires, d’autres optionnelles; enfin toutes les instructions se terminent par un point 7. Pour exécuter l’instruction, marquer celle-ci à l’aide de la souris, puis cliquer sur la flèche Î dans la barre d’outil 30
31
¾Dans le cliché suivant, remarquons que : – La ligne de commande s’est inscrite dans la fenêtre Résultats (Outputs) – Directement à la suite, sont affichés les résultats de l’analyse 32
33
¾Observons tout d’abord dans le tableau « Statistiques » que l’effectif total (N valide) est de 1805 pour la variable santé auto-évaluée, contre 2101 pour les deux autres variables ¾Ceci est dû au fait que les personnes enquêtées via un proxi (n=263) n’ont bien sûr pas été interrogées à ce propos, et que 33 personnes interrogées n’ont pas répondu 34
35
¾Par ailleurs, on voit que l’échantillon se compose d’autant de résidants en Valais qu’à Genève, d’autant d’hommes que de femmes ¾Cette « étrangeté » est due au caractère stratifié de l’échantillon ¾57% évaluent leur état de santé comme « bon » ou « très bon » (moyenne par rapport à l’échelle de 3.66) 36
¾ Pour l’heure, laissons de côté ces chiffres et procédons à une seconde analyse : un histogramme de la distribution de la variable santé auto-évaluée 1. Pour cela, aller dans le menu Analyse Statistique descriptive Explorer (Examine) 37
38
2. Dans la fenêtre qui apparaît, sélectionner la variable 3. Cocher la case Graphiques 4. Cliquer sur Diagrammes 39
5. Dans la fenêtre qui apparaît, cocher la case Aucun(e) dans la rubrique Boîte à moustaches 6. Cocher la case Histogramme dans la rubrique Diagramme descriptif 7. Cliquer sur Poursuivre 40
8. Dans la fenêtre principale, comme précédemment, cliquer sur Coller 41
¾ Dans la fenêtre syntaxe, la nouvelle commande « Examine » (explorer) est venu s’inscrire à la suite de l’instruction antérieure 9. Comme précédemment, marquer l’instruction et lancer l’exécution en cliquant sur la flèche Î dans la barre d’outil 42
43
¾Dans la fenêtre Résultats (Outputs), figure maintenant l’histogramme demandé 44
¾Revenons au caractère étrange des distributions de nos variables ¾Dans notre échantillon, – il y a autant de résidants en Valais qu’à Genève; or, en réalité, la population du canton de Genève est plus nombreuse que celle du Valais central – il y autant d’hommes que de femmes; or, nous le savons bien, la population âgée est en réalité à majorité féminine 45
¾Ceci est dû au plan d’échantillonnage de l’enquête, qui a reposé sur une stratification selon le canton, le sexe et les catégories d’âge quinquennales ¾A ce titre, l’échantillon n’est pas représentatif de la population – les hommes sont surreprésentés dans l’échantillon, comme le sont les personnes plus âgées 46
¾De plus, ce caractère non représentatif peut aussi mettre en doute la validité de la description de la santé auto-évaluée – comme l’état de santé tend à se détériorer avec l’âge, le fait qu’il y ait une surreprésentation des personnes plus âgées dans l’échantillon pourrait conduire à ce que le résultat de notre analyse sous-estime le bon état de santé dans la population 47
– les travaux dans le domaine s’accordent sur le fait que les femmes, si elles vivent plus longtemps, ont davantage de problèmes de santé que les hommes; comme les femmes sont sous- représentées dans notre échantillon, le résultat de notre analyse pourrait à l’inverse surestimer le bon état de santé de la population 48
¾Si on veut pouvoir inférer les résultats obtenus sur la base de notre échantillon à l’univers dont il est issu et être capable de poser des affirmations plus générales sur la population âgée, il faut corriger la structure de l’échantillon ¾Utilisation d’un coefficient de pondération : les individus, plutôt que d’être affecté d’un même poids dans les analyses, se voient attribués des poids différents selon le sexe et la catégorie d’âge auxquels ils appartiennent 49
¾On peut ainsi rétablir la « vraie » structure de la population (univers de référence) ¾Notons aussi que l’enquête de terrain finie, on s’est rendu compte d’une surreprésentation des personnes âgées en institution dans l’échantillon : le coefficient de pondération corrige également ce fait ¾Par contre, il ne corrige pas la distribution entre cantons : l’addition de Genève+Valais ne constitue pas une population faisant sens 50
¾ Pour indiquer à SPSS d’utiliser un coefficient de pondération (la variable doit être créée précédemment) 1. Aller dans le menu Données Pondérer les observations 51
52
2. Dans la fenêtre qui s’affiche, sélectionner la variable de pondération (ici variable coefpond) 3. Puis cliquer sur Coller 53
¾ L’instruction s’inscrit dans la fenêtre de syntaxe ¾ Répétons les mêmes analyses que précédemment, cette fois en tenant compte de la pondération 1. Pour cela, il suffit d’aller dans la fenêtre de syntaxe, de copier les instructions d’analyse déjà utilisées et de les coller à la suite de la commande requérant l’utilisation de la pondération 54
55
2. Marquer la suite d’instructions et lancer l’exécution 56
57
¾Les commandes et les résultats des analyses s’inscrivent dans la fenêtre Résultats (Outputs) 58
¾L’utilisation du coefficient de pondération ne modifie pas la distribution de l’échantillon selon le canton ¾Par contre, elle change les proportions d’hommes et de femmes : ces dernières représentent désormais le 59% de l’ensemble 59
60
61
¾La distribution de la santé auto-évaluée se modifie peu : le score moyen est à peine plus élevé (3.74 contre 3.66); la proportion de personnes disant être en « mauvaise » ou « très mauvaise » santé est de 7%, contre 9% précédemment ¾Cette relative stabilité entre l’avant et l’après pondération peut étonner ¾Comment l’expliquer? 62
¾D’un côté, la pondération donne plus de poids aux personnes les plus jeunes de l’échantillon : effet positif sur l’état de santé ¾De l’autre, la pondération donne plus de poids aux femmes : effet négatif sur l’état de santé 63
¾En plus de ce phénomène de balance entre deux effets de sens contraire, l’état de santé auto-évalué est plus stable que la santé objective : processus de régulation psycho-sociale (par exemple, comparaison sociale) 64
¾Pour documenter son travail, on peut sauvegarder le contenu de la fenêtre syntaxe dans un fichier du même type (extension .sps) ¾Y compris en ajoutant une brève description des procédures suivies, voire de ce qui motive ces procédures ¾Les lignes de commentaires doivent débuter par un astérisque « * » ¾Ci-après une petite illustration 65
66
Comment exporter les résultats des analyses dans un fichier texte? ¾ Pour exporter tout ou partie d’un fichier résultats de SPSS 1. Se placer dans la fenêtre résultat 2. Aller dans le menu Fichier Exporter 67
68
¾ Dans la fenêtre qui s’affiche, 3. Indiquer Sortie document (défaut) 4. Choisir les objets à exporter (tout ce qui est dans la fenêtre « Résultats » n’est pas forcément utile) 5. Choisir le type de fichier vers lequel exporter (ici fichier word/rtf) 6. Choisir l’emplacement et le nom du fichier qui sera créé 7. Cliquer sur OK 69
70
Vous pouvez aussi lire