Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum

 
CONTINUER À LIRE
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
« Building a course or curriculum
         around a corpus »
  Construire un cours ou un
curriculum basé sur un corpus
       mercredi 13 novembre, 10h15
              salle S1, ILCF
                   Thomas Cobb
         Université du Québec à Montréal
       < https://lextutor.ca/neuchatel.pdf >
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Plan de la présentation
1. Des définitions et le   6. Le lexique des cours et
   contexte                   des programs
2. L’idée principale       7. Le lexique des examens
3. Les testes              8. Les références
4. Les profils             9. Voir quelque logiciels
5. Testes x profils

                                                        2
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
1. Définitions, context, rationale
Corpus
    • Recueil de textes échantillonnés
      • Ex Brown Corpus (1960s)
         • 1 million de mots
         • 500 textes de 15 types de 2000 mots chacun
      • BNC (1980s)
         • 100 million de mots
         • 4000 textes 100 types de 25,000 mots chacun (env.)
      • COCA …
                                                                3
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Définitions
Corpus - comment analysé?

                            4
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Définitions
Moi

              5
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Définitions
“Data driven learning” or “corpus based learning”
(Apprentissage d’une langue à partir des données linguistiques traité par ordinnateur)
(Apprentissage orienté par les données - AOD)

                                                                                    6
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Idée de base du DDL
• Learning happens through input, OK
BUT
• Natural input reveals its patterns slowly
• - too slowly to be effective in L2 learning
   • In the vast majority of cases
• Input can however be treated by computer programs to expose
  patterns more quickly and clearly
• - to create more ‘learnable’ input
   • Patterns exposed through data (1) accumulation and (2) analysis

                                                                       7
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Learning from corpora (=DDL)
Apprendre à travers l'utilisation des corpus / Apprentissage faisant appel aux corpus

• Récemment montré efficace de façon concluante (2017)
                                                     Comparé à une gamme d'autres
                                                     moyens d'apprendre…
                                                             Le vocabulaire
                                                             Les locutions
                                                             Le syntaxe
                                                             La grammaire
                                                             La culture

                                                     … DDL ‘GAGNE’ par la taille de l'effet de
                                                     1,5 écarts-types (effect size of 1.5) pour
                                                     les études pré-post

                                                     Ex. Control Group Mean 65, SD 15
                                                         DDL Group Mean     80, SD 15

                                                                                                  8
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Qu'est-ce qu'une activité d'apprentissage
basée sur un corpus?
Exemple 1 – Construire les significations des mots au moyen de…

                                      vs.→

                                                                  9
Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
Qu'est-ce qu'une activité d'apprentissage
 basée sur un corpus?
Exemple 2 – sensibilisation à la culture
Tâche
• Do concordance searches for ‘woman’ with collocation ‘man’ on either side in English,
  French, and Spanish corpora of the same size
    • Woman - man
    • Femme – homme
    • Mujer – hombre
Then in a one-page report:
• Is the sequence always man first then woman second across these three languages?
• In which language is there most variation in the sequence?
• Read the contexts for the least variable language – is the common sequence formulaic
  or does it seem to indicate a belief in the superiority of one gender?
                                                                                   10
   • Or with one gender typically acting and the other being acted upon?
11
Pourquoi cette méthode d'apprentissage
devrait-elle en principe être efficace?

                                          12
…
CALL (ALAO) - Apprentissage des   6 novembre 2019
langues assisté par ordinnateur

On dit que le “virage
numérique” à l’école
manque des
bases -
soit théorique, soit
empirique

DDL peut en fournir
les deux                                            13
2. Mais l'apprentissage par corpus n'est pas le
objet d'aujourd'hui

    • Du moins non pas le objet principal

                                              14
Le sujet est la conception des cours et des
programmes à l'aide d'un corpus
   • incorporant un programme lexical (« lexical syllabus »)
      • Dans le contexte du développement de la lecture

Pourquoi lexical ?
• De plus en plus, les recherches montrent que l'apprentissage de langage en
  tout aspect commence par le lexique

   • Et est limité par l'étendue du lexique de l’apprenant

• Et que les apprenants n’obtiennent généralement pas assez de vocabulaire
  lors de leurs cours de langue

                                                                           15
Conception de cours à partir d’un corpus

Comment?
• Trouver un corpus de français qui correspond aux
  objectifs linguistiques de vos apprenants
  • Ou le français général
  • Ou le français littéraire
  • Ou de commerce
  • Ou de la médecine, etc.

• … qui a été transformé en une liste de mots organisée
  par leurs occurrences/fréquences dans le corpus
                                                          16
Le corpus utilisé par Lextutor
 Corpus                          Liste

                                         17
•a
     Alphabetisé,    Aller 10,000
     lemmatisé, et      vais 3,000
     re-trié pour       vas    750
     donner les         allé   500
     fréquence des      etc.
     lemmes          SOMME 14,250
     entiers

                                     18
… et divisés en groupes de 1,000 lemmas
 1k       2k     3k       4k     5k etc … →25k

                                            19
Ce qui fait que chaque mot a son numéro

                                Dans l'ordre dans lequel
                                ils se produisent dans le
                                environnement,
                                et dans lequel ils seront
                                typiquement rencontrés
                                et appris

                                                   20
Alors, à partir d’un corpus et de sa liste de mot-
lemmes, qu'est-ce qu'on obtient?

     Que peut-on faire avec ca?

• En termes simples, on a un moyen d'assurer le
  développement systématique du vocabulaire

                                                     21
3. Les testes diagnostiques

                              22
Les testes de la
 taille ou du niveau
de vocabulaire
des apprenants

• Exemple validé et publié
   (Le “TTV”, RCLV, 2016)

                             23
24
Mais à partir de la liste, on peut aussi faire
son propre test
• Format Oui-Non

                                                 25
26
27
28
4. Le profilage des textes

                             29
Les profiles des textes
par niveau de fréquence
 (ou, Le profilage des textes par
 fréquence lexicogaphique)

 • Aussi connu comme
   LFP et Vocabprofil(e) – “VP”

 • Par exemple, ce texte-ci →
   (893 mots)
   Du vocabulaire simple ou
   sophistiqueé ?
                                    30
Colour-coded k-levels

       →
       

                        31
Ou, par contre, ce texte-ci ~
• Hier Daisy s'était levée tôt ce
  matin de printemps. Elle
  travaillait sur une affaire dans la
  ville voisine. Elle arriva à son
  bureau à huit heures avec à la
  main un sac en papier contenant
  des petits pains. Elle mourrait
  d'envie d'une tasse de café.
  Note – Demo only; short texts = unreliable VP

                                                  32
Daisy le matin   L’abandon scolaire

Un tant soit peu différent→
Mais aurait-on pu
remarquer à quel point ?

                                                             33
5. Les testes x les profils

                              34
Quand nous connaissons
les niveau des apprenants, et
nous connaissons les niveaux
des textes, sur la même unité
de comptage ...

  • Sûrement c’est une information qu’on peut utiliser !
     • Pour assortir apprenants et tâches

     • Mais nous avons d’abord
       besoin de quelques faits
       empiriques
                                                           35
36
Heureusement, Lextutor tient des registres
   (keeps records)

                                             37
Parmi les
apprenants
suffisamment
intéressés pour
passer le test,
moins de 50%
ont obtenu un
score >70% à 3k

Alors disons
qu’ils
connaissent
2 ,500 mots
               38
Ils connaissent 95% des             Abandon scolaire   Ils connaissnt 98% des mots
mots d’un text                                         d’un text
• Ils peuvent manier                                   • Ils peuvent manier
   Texte écrit, parlé,                                   Texte écrit, parlé
  interactive                                          • SANS RESSOURCES
   AVEC RESSOURCES
                                                          • Lecture/écout independent
   •   dictionnaire,
   •   demandes de clarification,
   •   contexte partagé,
   •   ‘replay button’
                                                          • ce qui correspond
• ce qui correspond                                         à 8,000 mots-lemmes
  à 3,000 mots-lemmes                                        dans des "textes typiques"
   dans des "textes typiques"
                                                                                        39
Les étudiants qui ont pris le TTV peuvent-ils
lire le texte 'Abandon scolaire'?
Oui, mais ~
                                Apprenants
• Avec beaucoup de              sont ici →
  difficulté
                                              Comprehension
• Et malentendus                             avec ressources
• Et recours fréquent                        commence ici
  aux ressources
                                              Sans ressources
 En nombre de mots
 At 98% des mots connus,
  18 mots inconnus (sur 893)
 At 95%,
   40 mots inconnus
 At 92% (nos apprenants K-2),
  76 mots inconnus                                       40
Alors quoi en faire ?
Exploiter VP pour trouver des textes utile pour vos apprenants
   • (Supposant des textes digitals)

• Utile – comment ?
   1. Des textes utile pour la pratique de la fluidité (for fluency practice)
        • Trouver ceux qui corresponde au niveau 98% ou plus de vos apprenants

   2. Des textes utile pour la croissance (for growth)
      • Trouver ceux qui corresponde au niveau 95% ou moins de vos apprenants
          • mais accompagné de ressources

                                                                                 41
Cas 1: la croissance
 • Supposons des apprenants
   au niveau 3k
 • Voici un texte qui pourrait les
   intéresser             →
     • ‘Trump hors prix’
        Du site « France 24 »
        977 mots / video
 • Dans ce texte, 3k leur donne
   seulement ~90% des mots
 • Donc env. 10% (~100 mots)
   probablement inconnu
     • Un peu trop difficile
     • Mais beaucoup d'occasions
       d'apprentissage !
 • Avec quelles ressources?
                                     42
Ressources hyper-
textuelles
Ce texte sera lié au…
• Dictionnaire bilingue
• Audio
    • Narratif ou des
      mots/locutions individuels
• Video
• Images
• Collecte de mots en ‘box’
• Envoi des mots aux activités
  d’apprentissage
• Mobile ou laptop                 43
Je m'appelle Hugo et j'ai 16 ans. Aujourd'hui,

      Cas 2 - la fluidité               avec mes parents et ma sœur nous partons en
                                        voyage. Ma sœur s'appelle Laura, elle a 13
                                        ans. Nous sommes à l'aéroport - direction
 • Trouver des textes près du           Barcelone en Espagne !
    niveau de vos apprenants
                                        J'ai déjà pris l'avion car nous sommes allés à
                                        Rome en Italie, il y a deux ans. A Barcelone,
                                        mes parents ont réservé une maison près de
                                        la plage. Mes parents souhaitent louer des
                                        vélos pour visiter Barcelone. Ils veulent visiter
                                        la fameuse Sagrada Familia, se promener dans
                                        le Parc Güell et goûter la nourriture locale.
                                        Moi, je veux aller au zoo et à l'aquarium... et
                                        manger des glaces. Ma sœur préfère aller à la
                                        plage pour lire et bronzer. Nous restons
                                        pendant deux semaines à Barcelone.

                                        J'espère qu'il y aura beaucoup de soleil. Je
                                        n'aime pas la pluie, surtout pendant les
                                        vacances.
Voyez-vous un problème avec ce texte?
                                                                                            44
5.2 la fluidité
• Trouver des textes près du
   niveau de vos apprenants

• OU ~
• Reduire le niveau du texte
  qui est interessant a vos
  apprenants mais qui
  est trop complexe…
• … en utilisant le service
  ‘Edit-to-a-Profile’ de
  Lextutor-VP

                               45
46
+ d’autres outils de “rédaction pédagogique”

                                               47
6. Auto-Evaluation du lexique de
      vote cours ou program
Une fois que vous avez rassembler tout votre cours dans
un seul fichier texte, utilisez VP-Negative pour
determiner…
     > Quels sont les mots qui manquent?
     > De peu ou de beaucoup?
• Ensuite, faites des cours supplémentaires –
  > Group Lex,
  > cartes mémoire (flash cards)
  > recherche de mots par texte
                                                          48
724 presents. Mais comment savoir lesquels ne sont PAS presents?

                                                                   49
Vaut-il la peine de s’inqueter pour les 276
mots qui manquents? (27.6% du K1)

Reflechir:
• L’apprenant qui connait tous les mots au K1, connaîtra 90% des mots
  des textes typiques
   • Pas très loin de 95% (comprehensible avec des ressources)
Par contra
• L’apprenant qui n’en connaît que 724 au K1
   • connaitra (90% x 72%)=58% des mots des textes typiques
       • Bien loin de 95%

                                                                        50
Pas mal différent! - connaître 90% v 70%

                                           51
Alors pour les mots qui manque?
• Une fois identifies …

                                  52
53
54
Ou alors →

             55
Si ‘comtempler’ est un mot qui manque…

                                         56
7. Les examens

                 57
Principes
• les apprenants ne doivent jamais rencontrer de nouveaux mots dans
  un examen qu'ils n'ont jamais vu au moins X fois auparavant...
   • X=… 3?

• Sauf si l'objectif est de tester l’habilité à inférer les sens des nouveaux
  mots en contexte
   • Et les apprenants ont pratiqué cette activité

Contrôle du vocab ~
• Facile à dire, difficile à faire !

                                                                            58
Mais avec des outils informatiques…
• Si vous avez ramassé tous vos manuels scolaires et autres
  supports de cours dans un fichier informatique…
• Et si votre examen est en forme de fichier informatique…
• Alors Range peut identifier les mots qui sont présents sur
  Fichier « B », mais non pas sur Fichier « A »
  • Donc vous obtenez une liste de tous les mots que les
    apprenants pourraient rencontrer pour la première fois dans
    l’examen même

                                                                  59
Des mots partagés et non…

                            60
8. RÉFÉRENCE
      (soit mentionnées, soit pertinentes au DDL en FL2)
                                                                    • Ovtcharov, V. , Cobb, T. et al (2006) La richesse
• Cobb. T. & Horst, M. (2020). Bringing home the word.
                                                                      lexicale des productions orales : mesure fiable du
  Canadian Mod. Language Review.
                                                                      niveau de compétence langagière. In Cobb, T. &
• Boulton, A. & Cobb, T. (2017) Corpus use in language learning:      Horst, M. (Eds). Deuxième édition spéciale sur le
  A meta-analysis. Language Learning, 65 (2), 1-46.                   vocabulaire, Revue Canadienne des Langues
• Batista, R. & Horst, M. (2016). A new receptive vocabulary size     Vivantes, 63(1), 107-125.
  test for French. Can. Mod. Lang. Rev., 72(2), 211-233.            • Cobb, T. (2003). Analyzing late interlanguage with
• Cobb, T. (2014). A resource wish-list for data-driven learning      learner corpora: Quebec replications of three
  in French, in French through Corpora: Ecological and Data-          European studies. Canadian Mod. Language
  Driven Perspectives in French Language Studies (Eds. H. Tyne,       Review, 59(3), 393-423
  A. Boulton, et al). Newcastle, UK: Cambridge Scholars.            • Cobb et al (2001). Peut-on augmenter le rythme
• Cobb, T. & Horst, M. (2004). Is there room for an AWL in            d’acquisition lexicale par la lecture ? Une
  French? In Bogaards, P. & Laufer, B. (Eds.), Vocabulary in a        expérience de lecture en français appuyée sur une
  Second Language: Selection, acquisition, and testing (pp. 15-       série de ressources en ligne. In P. Raymond et
  38). Amsterdam: John Benjamins.                                     al, Regards sur la didactique des langues
                                                                      secondes. Montréal: Éditions logique.
                                                                                                                61
L’article de 2020 en anglais mais assez
accessible
   Résumé : Les recherches menées au cours des années 80 et 90 sur le vocabulaire ont
   apporté un bol d’air frais à l’enseignement linguistique. Dans beaucoup de pays éloignés,
   les enseignants d’anglais comme langue étrangère soupçonnaient depuis longtemps que
   le plus grand défi pour leurs étudiants était le vocabulaire, mais les recherches existantes
   offraient peu de preuves de ce constat et aussi peu de solutions. Puis, brusquement,
   Nation, Laufer, Meara, Schmitt et d’autres ont avancé un éventail d’idées très
   prometteuses et des applications concrètes : le séquencement et l’évaluation du
   vocabulaire selon la fréquence d’utilisation ; la différenciation entre le vocabulaire de base
   et le vocabulaire avancé, universitaire et technique ; l’interaction de la connaissance du
   vocabulaire et de la connaissance de la grammaire — autant d’idées qui ouvraient
   véritablement de nouvelles perspectives. Après avoir consacré une décennie à mettre ces
   idées en pratique et, nous l’espérons, à contribuer aux progrès ainsi rendus possibles
   dans des pays en développement (Arabie Saoudite, Oman, Hong Kong), les auteurs
   reviennent au Canada en se demandant quels aspects de ce travail y seraient
   applicables, le cas échéant, moyennant quels types de modifications, et ce qui pourrait y
   être greffé. Des idées d’une pertinence évidente dans un pays en développement,
   seraient-elles aussi pertinentes pour un pays développé ? Les auteurs brossent le tableau
   du vocabulaire tel qu’ils l’ont trouvé au Canada à leur retour, décrivent ce qu’ils essaient
   d’y apporter et formulent des propositions pour les prochaines étapes.
    ReplyReply allForward                                                                           62
9. Voir quelques logiciels ‘live’ ?
Testes                      Group Lex
• lextutor.ca/tests/        • lextutor.ca/group_lex/demo_lab_m
Vocabprofil                   od/index.php?ling=fr
• lextutor.ca/vp/comp/      Flashcards
VP1 (mobile)                • lextutor.ca/m/flash/
• lextutor.ca/m/vp1/        Range
Fréquencier                 • https://www.lextutor.ca/cgi-
                              bin/range/texts/
• lextutor.ca/freq/fr/      Concordancier
Hypertexte                  • https://www.lextutor.ca/conc/fr/
• lextutor.ca/hyp/2/

          < https://lextutor.ca/neuchatel.pdf >              63
Vous pouvez aussi lire