Construire un cours ou un curriculum basé sur un corpus - around a corpus " " Building a course or curriculum
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
« Building a course or curriculum
around a corpus »
Construire un cours ou un
curriculum basé sur un corpus
mercredi 13 novembre, 10h15
salle S1, ILCF
Thomas Cobb
Université du Québec à Montréal
< https://lextutor.ca/neuchatel.pdf >Plan de la présentation
1. Des définitions et le 6. Le lexique des cours et
contexte des programs
2. L’idée principale 7. Le lexique des examens
3. Les testes 8. Les références
4. Les profils 9. Voir quelque logiciels
5. Testes x profils
21. Définitions, context, rationale
Corpus
• Recueil de textes échantillonnés
• Ex Brown Corpus (1960s)
• 1 million de mots
• 500 textes de 15 types de 2000 mots chacun
• BNC (1980s)
• 100 million de mots
• 4000 textes 100 types de 25,000 mots chacun (env.)
• COCA …
3Définitions
“Data driven learning” or “corpus based learning”
(Apprentissage d’une langue à partir des données linguistiques traité par ordinnateur)
(Apprentissage orienté par les données - AOD)
6Idée de base du DDL
• Learning happens through input, OK
BUT
• Natural input reveals its patterns slowly
• - too slowly to be effective in L2 learning
• In the vast majority of cases
• Input can however be treated by computer programs to expose
patterns more quickly and clearly
• - to create more ‘learnable’ input
• Patterns exposed through data (1) accumulation and (2) analysis
7Learning from corpora (=DDL)
Apprendre à travers l'utilisation des corpus / Apprentissage faisant appel aux corpus
• Récemment montré efficace de façon concluante (2017)
Comparé à une gamme d'autres
moyens d'apprendre…
Le vocabulaire
Les locutions
Le syntaxe
La grammaire
La culture
… DDL ‘GAGNE’ par la taille de l'effet de
1,5 écarts-types (effect size of 1.5) pour
les études pré-post
Ex. Control Group Mean 65, SD 15
DDL Group Mean 80, SD 15
8Qu'est-ce qu'une activité d'apprentissage
basée sur un corpus?
Exemple 1 – Construire les significations des mots au moyen de…
vs.→
9Qu'est-ce qu'une activité d'apprentissage
basée sur un corpus?
Exemple 2 – sensibilisation à la culture
Tâche
• Do concordance searches for ‘woman’ with collocation ‘man’ on either side in English,
French, and Spanish corpora of the same size
• Woman - man
• Femme – homme
• Mujer – hombre
Then in a one-page report:
• Is the sequence always man first then woman second across these three languages?
• In which language is there most variation in the sequence?
• Read the contexts for the least variable language – is the common sequence formulaic
or does it seem to indicate a belief in the superiority of one gender?
10
• Or with one gender typically acting and the other being acted upon?11
Pourquoi cette méthode d'apprentissage
devrait-elle en principe être efficace?
12… CALL (ALAO) - Apprentissage des 6 novembre 2019 langues assisté par ordinnateur On dit que le “virage numérique” à l’école manque des bases - soit théorique, soit empirique DDL peut en fournir les deux 13
2. Mais l'apprentissage par corpus n'est pas le
objet d'aujourd'hui
• Du moins non pas le objet principal
14Le sujet est la conception des cours et des
programmes à l'aide d'un corpus
• incorporant un programme lexical (« lexical syllabus »)
• Dans le contexte du développement de la lecture
Pourquoi lexical ?
• De plus en plus, les recherches montrent que l'apprentissage de langage en
tout aspect commence par le lexique
• Et est limité par l'étendue du lexique de l’apprenant
• Et que les apprenants n’obtiennent généralement pas assez de vocabulaire
lors de leurs cours de langue
15Conception de cours à partir d’un corpus
Comment?
• Trouver un corpus de français qui correspond aux
objectifs linguistiques de vos apprenants
• Ou le français général
• Ou le français littéraire
• Ou de commerce
• Ou de la médecine, etc.
• … qui a été transformé en une liste de mots organisée
par leurs occurrences/fréquences dans le corpus
16Le corpus utilisé par Lextutor
Corpus Liste
17•a
Alphabetisé, Aller 10,000
lemmatisé, et vais 3,000
re-trié pour vas 750
donner les allé 500
fréquence des etc.
lemmes SOMME 14,250
entiers
18… et divisés en groupes de 1,000 lemmas
1k 2k 3k 4k 5k etc … →25k
19Ce qui fait que chaque mot a son numéro
Dans l'ordre dans lequel
ils se produisent dans le
environnement,
et dans lequel ils seront
typiquement rencontrés
et appris
20Alors, à partir d’un corpus et de sa liste de mot-
lemmes, qu'est-ce qu'on obtient?
Que peut-on faire avec ca?
• En termes simples, on a un moyen d'assurer le
développement systématique du vocabulaire
213. Les testes diagnostiques
22Les testes de la
taille ou du niveau
de vocabulaire
des apprenants
• Exemple validé et publié
(Le “TTV”, RCLV, 2016)
2324
Mais à partir de la liste, on peut aussi faire
son propre test
• Format Oui-Non
2526
27
28
4. Le profilage des textes
29Les profiles des textes
par niveau de fréquence
(ou, Le profilage des textes par
fréquence lexicogaphique)
• Aussi connu comme
LFP et Vocabprofil(e) – “VP”
• Par exemple, ce texte-ci →
(893 mots)
Du vocabulaire simple ou
sophistiqueé ?
30Colour-coded k-levels
→
31Ou, par contre, ce texte-ci ~
• Hier Daisy s'était levée tôt ce
matin de printemps. Elle
travaillait sur une affaire dans la
ville voisine. Elle arriva à son
bureau à huit heures avec à la
main un sac en papier contenant
des petits pains. Elle mourrait
d'envie d'une tasse de café.
Note – Demo only; short texts = unreliable VP
32Daisy le matin L’abandon scolaire
Un tant soit peu différent→
Mais aurait-on pu
remarquer à quel point ?
335. Les testes x les profils
34Quand nous connaissons
les niveau des apprenants, et
nous connaissons les niveaux
des textes, sur la même unité
de comptage ...
• Sûrement c’est une information qu’on peut utiliser !
• Pour assortir apprenants et tâches
• Mais nous avons d’abord
besoin de quelques faits
empiriques
3536
Heureusement, Lextutor tient des registres
(keeps records)
37Parmi les
apprenants
suffisamment
intéressés pour
passer le test,
moins de 50%
ont obtenu un
score >70% à 3k
Alors disons
qu’ils
connaissent
2 ,500 mots
38Ils connaissent 95% des Abandon scolaire Ils connaissnt 98% des mots
mots d’un text d’un text
• Ils peuvent manier • Ils peuvent manier
Texte écrit, parlé, Texte écrit, parlé
interactive • SANS RESSOURCES
AVEC RESSOURCES
• Lecture/écout independent
• dictionnaire,
• demandes de clarification,
• contexte partagé,
• ‘replay button’
• ce qui correspond
• ce qui correspond à 8,000 mots-lemmes
à 3,000 mots-lemmes dans des "textes typiques"
dans des "textes typiques"
39Les étudiants qui ont pris le TTV peuvent-ils
lire le texte 'Abandon scolaire'?
Oui, mais ~
Apprenants
• Avec beaucoup de sont ici →
difficulté
Comprehension
• Et malentendus avec ressources
• Et recours fréquent commence ici
aux ressources
Sans ressources
En nombre de mots
At 98% des mots connus,
18 mots inconnus (sur 893)
At 95%,
40 mots inconnus
At 92% (nos apprenants K-2),
76 mots inconnus 40Alors quoi en faire ?
Exploiter VP pour trouver des textes utile pour vos apprenants
• (Supposant des textes digitals)
• Utile – comment ?
1. Des textes utile pour la pratique de la fluidité (for fluency practice)
• Trouver ceux qui corresponde au niveau 98% ou plus de vos apprenants
2. Des textes utile pour la croissance (for growth)
• Trouver ceux qui corresponde au niveau 95% ou moins de vos apprenants
• mais accompagné de ressources
41Cas 1: la croissance
• Supposons des apprenants
au niveau 3k
• Voici un texte qui pourrait les
intéresser →
• ‘Trump hors prix’
Du site « France 24 »
977 mots / video
• Dans ce texte, 3k leur donne
seulement ~90% des mots
• Donc env. 10% (~100 mots)
probablement inconnu
• Un peu trop difficile
• Mais beaucoup d'occasions
d'apprentissage !
• Avec quelles ressources?
42Ressources hyper-
textuelles
Ce texte sera lié au…
• Dictionnaire bilingue
• Audio
• Narratif ou des
mots/locutions individuels
• Video
• Images
• Collecte de mots en ‘box’
• Envoi des mots aux activités
d’apprentissage
• Mobile ou laptop 43Je m'appelle Hugo et j'ai 16 ans. Aujourd'hui,
Cas 2 - la fluidité avec mes parents et ma sœur nous partons en
voyage. Ma sœur s'appelle Laura, elle a 13
ans. Nous sommes à l'aéroport - direction
• Trouver des textes près du Barcelone en Espagne !
niveau de vos apprenants
J'ai déjà pris l'avion car nous sommes allés à
Rome en Italie, il y a deux ans. A Barcelone,
mes parents ont réservé une maison près de
la plage. Mes parents souhaitent louer des
vélos pour visiter Barcelone. Ils veulent visiter
la fameuse Sagrada Familia, se promener dans
le Parc Güell et goûter la nourriture locale.
Moi, je veux aller au zoo et à l'aquarium... et
manger des glaces. Ma sœur préfère aller à la
plage pour lire et bronzer. Nous restons
pendant deux semaines à Barcelone.
J'espère qu'il y aura beaucoup de soleil. Je
n'aime pas la pluie, surtout pendant les
vacances.
Voyez-vous un problème avec ce texte?
445.2 la fluidité
• Trouver des textes près du
niveau de vos apprenants
• OU ~
• Reduire le niveau du texte
qui est interessant a vos
apprenants mais qui
est trop complexe…
• … en utilisant le service
‘Edit-to-a-Profile’ de
Lextutor-VP
4546
+ d’autres outils de “rédaction pédagogique”
476. Auto-Evaluation du lexique de
vote cours ou program
Une fois que vous avez rassembler tout votre cours dans
un seul fichier texte, utilisez VP-Negative pour
determiner…
> Quels sont les mots qui manquent?
> De peu ou de beaucoup?
• Ensuite, faites des cours supplémentaires –
> Group Lex,
> cartes mémoire (flash cards)
> recherche de mots par texte
48724 presents. Mais comment savoir lesquels ne sont PAS presents?
49Vaut-il la peine de s’inqueter pour les 276
mots qui manquents? (27.6% du K1)
Reflechir:
• L’apprenant qui connait tous les mots au K1, connaîtra 90% des mots
des textes typiques
• Pas très loin de 95% (comprehensible avec des ressources)
Par contra
• L’apprenant qui n’en connaît que 724 au K1
• connaitra (90% x 72%)=58% des mots des textes typiques
• Bien loin de 95%
50Pas mal différent! - connaître 90% v 70%
51Alors pour les mots qui manque?
• Une fois identifies …
5253
54
Ou alors →
55Si ‘comtempler’ est un mot qui manque…
567. Les examens
57Principes
• les apprenants ne doivent jamais rencontrer de nouveaux mots dans
un examen qu'ils n'ont jamais vu au moins X fois auparavant...
• X=… 3?
• Sauf si l'objectif est de tester l’habilité à inférer les sens des nouveaux
mots en contexte
• Et les apprenants ont pratiqué cette activité
Contrôle du vocab ~
• Facile à dire, difficile à faire !
58Mais avec des outils informatiques…
• Si vous avez ramassé tous vos manuels scolaires et autres
supports de cours dans un fichier informatique…
• Et si votre examen est en forme de fichier informatique…
• Alors Range peut identifier les mots qui sont présents sur
Fichier « B », mais non pas sur Fichier « A »
• Donc vous obtenez une liste de tous les mots que les
apprenants pourraient rencontrer pour la première fois dans
l’examen même
59Des mots partagés et non…
608. RÉFÉRENCE
(soit mentionnées, soit pertinentes au DDL en FL2)
• Ovtcharov, V. , Cobb, T. et al (2006) La richesse
• Cobb. T. & Horst, M. (2020). Bringing home the word.
lexicale des productions orales : mesure fiable du
Canadian Mod. Language Review.
niveau de compétence langagière. In Cobb, T. &
• Boulton, A. & Cobb, T. (2017) Corpus use in language learning: Horst, M. (Eds). Deuxième édition spéciale sur le
A meta-analysis. Language Learning, 65 (2), 1-46. vocabulaire, Revue Canadienne des Langues
• Batista, R. & Horst, M. (2016). A new receptive vocabulary size Vivantes, 63(1), 107-125.
test for French. Can. Mod. Lang. Rev., 72(2), 211-233. • Cobb, T. (2003). Analyzing late interlanguage with
• Cobb, T. (2014). A resource wish-list for data-driven learning learner corpora: Quebec replications of three
in French, in French through Corpora: Ecological and Data- European studies. Canadian Mod. Language
Driven Perspectives in French Language Studies (Eds. H. Tyne, Review, 59(3), 393-423
A. Boulton, et al). Newcastle, UK: Cambridge Scholars. • Cobb et al (2001). Peut-on augmenter le rythme
• Cobb, T. & Horst, M. (2004). Is there room for an AWL in d’acquisition lexicale par la lecture ? Une
French? In Bogaards, P. & Laufer, B. (Eds.), Vocabulary in a expérience de lecture en français appuyée sur une
Second Language: Selection, acquisition, and testing (pp. 15- série de ressources en ligne. In P. Raymond et
38). Amsterdam: John Benjamins. al, Regards sur la didactique des langues
secondes. Montréal: Éditions logique.
61L’article de 2020 en anglais mais assez
accessible
Résumé : Les recherches menées au cours des années 80 et 90 sur le vocabulaire ont
apporté un bol d’air frais à l’enseignement linguistique. Dans beaucoup de pays éloignés,
les enseignants d’anglais comme langue étrangère soupçonnaient depuis longtemps que
le plus grand défi pour leurs étudiants était le vocabulaire, mais les recherches existantes
offraient peu de preuves de ce constat et aussi peu de solutions. Puis, brusquement,
Nation, Laufer, Meara, Schmitt et d’autres ont avancé un éventail d’idées très
prometteuses et des applications concrètes : le séquencement et l’évaluation du
vocabulaire selon la fréquence d’utilisation ; la différenciation entre le vocabulaire de base
et le vocabulaire avancé, universitaire et technique ; l’interaction de la connaissance du
vocabulaire et de la connaissance de la grammaire — autant d’idées qui ouvraient
véritablement de nouvelles perspectives. Après avoir consacré une décennie à mettre ces
idées en pratique et, nous l’espérons, à contribuer aux progrès ainsi rendus possibles
dans des pays en développement (Arabie Saoudite, Oman, Hong Kong), les auteurs
reviennent au Canada en se demandant quels aspects de ce travail y seraient
applicables, le cas échéant, moyennant quels types de modifications, et ce qui pourrait y
être greffé. Des idées d’une pertinence évidente dans un pays en développement,
seraient-elles aussi pertinentes pour un pays développé ? Les auteurs brossent le tableau
du vocabulaire tel qu’ils l’ont trouvé au Canada à leur retour, décrivent ce qu’ils essaient
d’y apporter et formulent des propositions pour les prochaines étapes.
ReplyReply allForward 629. Voir quelques logiciels ‘live’ ?
Testes Group Lex
• lextutor.ca/tests/ • lextutor.ca/group_lex/demo_lab_m
Vocabprofil od/index.php?ling=fr
• lextutor.ca/vp/comp/ Flashcards
VP1 (mobile) • lextutor.ca/m/flash/
• lextutor.ca/m/vp1/ Range
Fréquencier • https://www.lextutor.ca/cgi-
bin/range/texts/
• lextutor.ca/freq/fr/ Concordancier
Hypertexte • https://www.lextutor.ca/conc/fr/
• lextutor.ca/hyp/2/
< https://lextutor.ca/neuchatel.pdf > 63Vous pouvez aussi lire