L'argument de la pauvreté du stimulus linguistique et la construction des questions fermées en anglais - Brill
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
L’argument de la pauvreté du stimulus linguistique et la construction des questions fermées en anglais Jérôme Puckica There is recent work suggesting that languages may indeed be learnable, but if so, that’s an empirical discovery. It is not a conceptual necessity. N. Chomsky (1996, 35) Depuis maintenant plusieurs décennies, le linguiste américain Noam Chomsky et les tenants de la grammaire générative promeuvent une hypothèse radicalement innéiste ou «nativiste» de la compétence linguistique suivant laquelle cette dernière serait «un savoir sans apprentissage véritable» (Pollock 1998, 11), largement inné. L’être humain serait génétiquement doté d’un module cognitif autonome spécialement dédié au langage, la Faculté de Langage (FL), dont l’état initial est nommé Grammaire Universelle (GU), et ce module lui permettrait d’acquérir, «sans véritablement l’apprendre», une quelconque langue humaine. Il faut souligner la spécificité de l’Hypothèse Innéiste (HI) ici considérée, qui va bien au-delà de l’observation triviale que les aptitudes langagières des êtres humains ont un certain fondement génétique. Le locuteur anglophone, par exemple, n’aurait pas à apprendre que he et Bill peuvent être coréférentiels dans Bill said he would come, mais pas dans He said Bill would come (Chomsky 2000, 93) : cet aspect de son savoir linguistique découlerait d’un des principes formels de la théorie du liage (Binding Theory), que GU est supposée contenir. De façon plus surprenante, peut-être, les significations lexicales seraient elles- mêmes largement innées (Chomsky 1996, 49 ; Smith 2004, 39). Il faut cependant noter que les présentations de GU, dont le contenu a souvent paru nébuleux (cf. Tomasello 2007), ont beaucoup évolué au cours des dernières années. L'époque où les faits linguistiques étaient «expliqués» par des propriétés, toujours plus nombreuses, de GU semble révolue, ou proche de l’être. Dans le Programme Minimaliste de la grammaire générative, Chomsky (2004, 2012a) ne suggère plus qu’une version extrêmement appauvrie de GU, bien éloignée du «very richly structured innate system» (Chomsky 1984, 429) qu’il postulait autrefois. Ce postulat semblait pourtant constituer un élément essentiel de sa théorie linguistique formelle. De fait, on voit mal comment une «thèse minimaliste forte» de GU pourrait être compatible avec celle d’un savoir linguistique sans véritable apprentissage (cf. Clark & Lappin 2010, 7-8). Université Stendhal - Grenoble 3, LIDILEM. Courriel : jerome.puckica@u-grenoble3.fr Downloaded from Brill.com06/13/2020 08:20:15AM via free access
92 Jérôme Puckica Divers arguments – souvent, de simples affirmations – compatibles avec l’Hypothèse Innéiste (HI) ont été avancés au fil des années, dont certains ne semblent plus vraiment d’actualité (cf. Pullum & Scholz 2002, Dabrowska 2004, Sampson 2005, Fortis 2008). Par exemple, Chomsky (1959, 28) soulignait la «remarquable rapidité» (nous traduisons) avec laquelle l’enfant acquiert sa langue maternelle, ajoutant : «this task is accomplished in an astonishingly short time».1 Désormais, il note que FL attendrait un état dit stabilisé «peut-être dès l’âge de six à huit ans» (Chomsky 2000, 118), soit une durée considérable au vu des circonstances (motivation, disponibilité, milliers d’heures d’exposition et de pratique, sollicitations, etc.), d’autant qu’il paraît maintenant établi que l’expérience (pré)linguistique de l’enfant commence avant même sa naissance.2 Cette durée ne légitime plus vraiment l’hypothèse d’importantes connaissances linguistiques innées, pas plus que celle d’une acquisition du langage qui serait facile ou «sans efforts» (Chomsky 1975, 144), autre affirmation fréquente. C’est au plus célèbre et, peut-on penser, au plus fondamental des arguments en faveur de HI que nous nous intéresserons ici : l’argument de la pauvreté du stimulus linguistique (APS), thème sur lequel Chomsky a donné une série de conférences en 2010 (cf. Chomsky 2012a). Dans sa formulation la plus générale, l’APS est l’argument suivant lequel le savoir(-faire) linguistique des locuteurs est sous-déterminé par les données linguistiques auxquelles ils ont été exposés. Cette formulation, toutefois, est trop vague, car on peut reconnaître au moins deux versions bien distinctes de l’APS.3 D’une part, une version faible, que personne ne conteste : il ne suffit pas d’être adéquatement exposé à une langue humaine pour pouvoir l’acquérir pleinement, puisque ni les rochers, ni les oiseaux, ni même les (autres) grands singes n’y parviennent (Chomsky 1986, 4) ; encore faut-il être humain et disposer de certaines aptitudes physiques et psychologiques qui, inévitablement, sont en partie génétiquement déterminées. C’est là une évidence qui n’implique aucunement l’existence de connaissances linguistiques innées. Même des activités qui n’ont rien de particulièrement «naturel», comme conduire une voiture, impliquent certaines prédispositions biologiques ; on en conclurait pas pour autant que l’être humain est génétiquement doté d’un module cognitif dédié à la conduite automobile (cf. Aitchison 2011, 5). C’est donc uniquement la version forte, spéculative et controversée de l’APS (ci-après 1 Chomsky (1962, 529) écrit encore : «Mere exposure to the language, for a remarkably short period, seems to be all that the normal child requires to develop the competence of the native speaker.» Chomsky & Halle (1968, 4) soulignent de même la grande vitesse («great speed») de ce phénomène. Toutes les citations traduites le sont par nos soins. 2 Cf. Kail & Fayol (2000), Karmiloff & Karmiloff-Smith (2001), Clark (2009), Boysson- Bardies (2010[1996]). Bien entendu, nombre de structures sont en place bien avant six ans. Inversement, d’autres ne le sont que plus tard, l’apprentissage se poursuivant jusqu’à l’âge adulte. Tout dépend de ce que l’on entend par acquisition. La définition qu’en donne Chomsky est demeurée sensiblement la même (i.e. lorsque l’enfant atteint un niveau de compétence comparable à celui d’un locuteur adulte), de sorte que l’évolution de sa position est notable. 3 Chomsky (2006, xi ; 2012a, 8) a souvent présenté la pauvreté du stimulus comme un truisme absolu (malgré sa récente série de conférences sur le thème), mais ceci ne peut raisonnablement s’appliquer qu’à la version faible de l’argument. Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Pauvreté du stimulus et construction des questions fermées en anglais 93 «APSF») qui nous intéressera ici, celle qui est censée soutenir HI. Une des formulations les plus claires en a été donnée par Hornstein & Lightfoot (1981, 9) : «People attain knowledge of the structure of their language for which no evidence is available in the data to which they are exposed as children.» Il existerait un «gouffre» (Chomsky 1986, xxv) entre les données de l’expérience (stimulus linguistique) et les connaissances acquises, un écart tel que l’acquisition du langage ne pourrait s'expliquer sans faire l’hypothèse d'importantes connaissances linguistiques innées, soit de GU. Ci-dessous, nous nous focaliserons sur l’exemple «classique» de l’APSF, qui porte sur la construction des questions fermées en anglais. Suivant Chomsky (1975), les jeunes enfants anglophones acquièrent une règle d’inversion sujet- auxiliaire pour former les questions fermées qui ne peut pas être induite du stimulus linguistique auxquels ils sont exposés. Cette acquisition ne pourrait s’expliquer que par l’existence d’un principe de «dépendance structurale» inscrit dans GU, qui stipule que les règles grammaticales font toutes référence à l’organisation hiérarchique des phrases (§1). Toutefois, l’absence des données linguistiques supposées indispensables à l’acquisition de la règle postulée est discutable et il y a en fait des raisons de douter du caractère indispensable de ces données (§2). On peut également douter de la nécessité d’inscrire un principe de dépendance structurale dans GU : l’organisation hiérarchique des structures linguistiques pourrait être le produit d’une faculté de hiérarchisation qui n’a rien de spécifiquement linguistique et ne requiert donc pas l’hypothèse de GU (§3). Enfin, l’exemple classique de l’APSF présuppose la réalité psychologique d’une règle de transformation syntaxique et le «problème logique de l’acquisition» que cet exemple est censé poser semble largement résulter de l’adoption d’un modèle grammatical formel et transformationnel. Nous proposerons une approche alternative, constructionnelle et «fondée sur l’usage», que soutiennent des études empiriques sur les productions linguistiques des jeunes enfants anglophones (§4). En d’autres termes, nous arguerons ici que l’exemple classique de l’APSF n’en établit pas la validité et qu’il ne légitime donc pas l’Hypothèse Innéiste. 1. L’EXEMPLE CLASSIQUE DE L’APSF L’exemple «classique» de l’APSF – on peut parler d’exemple classique au vu du nombre de ses mentions dans la littérature depuis les années 1970 – porte sur la construction des questions fermées en anglais.4 Les faits considérés sont ici des énoncés tels que (1-2) : (1a) The girl is happy. (1b) Is the girl happy? 4 Voir, entre autres, Chomsky (1975, 30-33 ; 1988, 41 sq. ; 2006, 54-55 ; 2012a, 10), Chomsky in Piattelli-Palmarini (1980, 39-40), Crain (1991, 602), Pinker (1994, 40-42), Radford (1997, 14-15), Laurence & Margolis (2001, 222-3), Legate & Yang (2002), Boeckx & Hornstein (2003), Collins (2003), Berwick et al. (2011) ; ou encore, mais de façon critique, Cowie (1998, 178 sq.), Pullum & Scholz (2002, 36 sq.) et Clark & Lappin (2010, 34 sq.). Downloaded from Brill.com06/13/2020 08:20:15AM via free access
94 Jérôme Puckica (2a) The girl who is smiling is happy. (2b) Is the girl who is smiling happy? (2c) *Is the girl who smiling is happy? Selon Chomsky (1975, 30-33), on peut envisager deux règles-procédures hypothétiques (R1) et (R2) au moyen desquelles l’enfant anglophone pourrait former des phrases interrogatives fermées à partir de déclaratives telles que (1a). Soit, en omettant divers détails : (3) (R1) : Repérer le premier auxiliaire contenu dans la phrase déclarative et le placer en position initiale pour former l’interrogative fermée correspondante. (R2) : Repérer le premier auxiliaire qui suit le premier GN dans la phrase déclarative et le placer en position initiale pour former l’interrogative fermée correspondante.5 (R1) est une règle «indépendante de la structure» (structure independent), i.e. une règle purement linéaire qui ne tient aucun compte de la structure interne des phrases, et plus spécifiquement de leur organisation syntagmatique : la phrase déclarative à partir de laquelle serait formée l’interrogative n’est envisagée que comme une simple séquence linéaire de symboles. Par opposition, (R2), qui correspond à ce que l’on appelle communément la règle d’inversion sujet- auxiliaire (ci-après «règle ISA»), est une règle «dépendante de la structure» (structure dependent) : elle présuppose une analyse syntagmatique de la phrase déclarative, soit une prise en compte de son organisation hiérarchique et non de sa seule organisation linéaire. Notons par ailleurs que les grammairiens générativistes rangent la copule be parmi les auxiliaires. Chomsky (id., 31) suggère que (R1) devrait être l’hypothèse que fait l’enfant par défaut, car c’est une règle «extrêmement simple» qui semble fonctionner dans l’immense majorité des cas. Mais (R1) est fausse : appliquée à une phrase telle que (2a), où le premier «auxiliaire» rencontré (la copule is) est contenu dans le GN sujet, elle produit la séquence agrammaticale (2c). Or, les jeunes enfants anglophones ne produiraient jamais de telles séquences.6 Suivant Chomsky, ils sélectionneraient systématiquement (R2), une règle pourtant bien plus complexe et improbable – «far more complex and “unlikely”» (id., 32) – car ils n’auraient pas la possibilité d’apprendre que (R1) est fausse : il faudrait pour cela qu’ils soient exposés à des phrases du type (2b), i.e. des interrogatives fermées dont le GN sujet contient un auxiliaire (ou la copule), mais celles-ci seraient extrêmement rares, si rares qu’un locuteur anglophone pourrait passer sa vie sans 5 Cf. Chomsky (1975, 31-32) : «Hypothesis 1: The child processes the declarative sentence from its first word (i.e. from “left to right”), continuing until he reaches the first occurrence of the word “is” (or others like it: “may,” “will,” etc.); he then preposes this occurrence of “is,” producing the corresponding question (with some concomitant modifications of form that need not concern us).» «Hypothesis 2: The child analyses the declarative sentence into abstract phrases; he then locates the first occurrence of “is” (etc.) that follows the first noun phrase; he then preposes this occurrence of “is,” forming the corresponding question.» 6 Voir ci-dessous nos remarques à propos de l’étude de Crain & Nakayama (1987). Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Pauvreté du stimulus et construction des questions fermées en anglais 95 jamais en produire ou y être exposé, comme l’a plusieurs fois noté Chomsky (sans jamais mentionner d’étude particulière sur le sujet).7 En fait, les phrases du type (2b) ne sont probablement pas aussi rares (cf. Pullum & Scholz 2002), mais elles semblent bien être essentiellement absentes des données linguistiques auxquelles ont accès les jeunes enfants anglophones, ou données linguistiques primaires (ci-après «DLP»), qui sont ici les seules données pertinentes (cf. §2). L’explication proposée par Chomsky (1975, 32-33) est que les jeunes enfants sélectionnent systématiquement (R2) aux dépens de (R1) parce qu’ils seraient pourvus d’un système linguistique inné (GU) qui contient un principe de «dépendance structurale» stipulant que les règles grammaticales sont (toutes) dépendantes de la structure : The only reasonable conclusion is that UG contains the principle that all such [grammatical] rules must be structure-dependent. That is, the child’s mind (specifically, its component LT(H,L) [i.e. Learning Theory for Human Language]) contains the instruction: Construct a structure-dependent rule, ignoring all structure- independent rules. The principle of structure dependence is not learned, but forms part of the conditions for language learning.8 Il a parfois été noté que (R1) et (R2) ne sont pas les seules règles qui permettent de former (1b) à partir de (1a) et qu’une explication empiriste devrait démontrer que les DLP des jeunes anglophones permettent d’éliminer toutes les règles possibles autres que (R2).9 Encore faudrait-il que les enfants effectuent de telles hypothèses (cf. §4). Si l’on adopte une analyse transformationnelle, toutefois, des règles telles que (R3) «déplacer n’importe quel auxiliaire en position initiale» (Lasnik & Uriagereka 2002, 148, trad.) ou (R4) «déplacer le dernier auxiliaire en position initiale» (Legate & Yang 2002, 152, trad.) devraient, en effet, elles aussi permettre de former (1b) à partir de (1a). Cependant, le stimulus linguistique des 7 Cf. Chomsky (1975, 32) : «[a] person may go through a considerable part of his life without ever facing relevant evidence» ; Chomsky in Piatelli-Palmarini (1980, 40) : «[a] person might go through much or all of his life without ever having been exposed to relevant evidence» (voir aussi p.114 et 115). 8 Voir aussi, entre autres, Chomsky (1988, 48), Chomsky (2006, 55) et Radford (1997, 14-15). Chomsky (2012a) propose une solution différente, mais ne vise plus à répondre aux mêmes questions. Il avance, entre autres, que l’organisation linéaire des phrases serait uniquement le produit de leur externalisation : les structures de la langue interne (LI) seraient hiérarchisées, mais non linéarisées. Par suite, les opérations de LI ne pourraient pas être linéaires et (R1) ne serait, peut-on penser, jamais envisagée. Toutefois, Chomsky (id., 11) note que cette hypothèse pose un «problème empirique» (auquel il n’offre aucun début de solution) : l’interprétation sémantique d’une phrase repose en partie sur l’ordre linéaire de ses composants, ce qui suggère que l’organisation linéaire des phrases préexiste à leur externalisation et n’est pas simplement imposée par le système sensori- moteur. Une stipulation – GU contient un principe de dépendance structurale – est remplacée par une autre – les structures de LI ne sont pas linéarisées – qui paraît bien plus problématique, puisqu’elle semble exclure de la grammaire toute notion de linéarité (donc de placement de X avant ou après Y), d’autant que l’organisation hiérarchique des structures linguistiques peut être expliquée différemment (cf. §3). 9 Cf. Legate & Yang (2002), Lasnik & Uriagereka (2002), Boeckx & Hornstein (2003). Downloaded from Brill.com06/13/2020 08:20:15AM via free access
96 Jérôme Puckica enfants anglophones ne se réduit évidemment pas à des couples d’énoncés tels que (1a-b). (R3) et (R4), par exemple, sont invalidées par (4a-c) ci-dessous, qui n’ont rien de particulièrement rare. Nous nous intéresserons donc ici essentiellement aux cas de (R1) et (R2). (4a) Have you been sleeping? (4b) Would you be quiet? (4c) Do you know what this is? Enfin, de nombreuses présentations de l’exemple classique de l’APSF invoquent une des expériences de Crain & Nakayama (1987), ci-après «C&N», mais en omettent certains résultats importants. Dans cette expérience, trente enfants anglophones âgés de 3;2 à 5;11 ans (âge moyen 4;7) étaient incités à poser des questions du type (2b) à une figurine nommée Jabba. Pour chaque question, l’instruction donnée à l’enfant était «Ask Jabba if [P]», avec [P] étant une déclarative telle que (5a), le but étant dans ce cas de tester si l’enfant savait produire (5b) : (5a) The boy who is watching Mickey Mouse is happy. (5b) Is the boy who is watching Mickey Mouse happy? (5c) *Is the boy who watching Mickey Mouse is happy? (5d) *Is the boy who’s watching Mickey Mouse is happy? (5e) *Is the boy that is watching Mickey Mouse, is he happy? Les publications qui mentionnent cette étude laissent souvent entendre que les sujets de C&N ont bien su former les questions attendues, qu’il n’ont pas produit de séquences agrammaticales du type (2c), et qu’ils semblaient ainsi maîtriser la règle (R2)/ISA.10 C&N (p.530) notent bien qu’aucune séquence du type (2c) n’a été produite, soit, dans le cas de (5a), aucune occurrence de (5c). Cependant, ils notent aussi que sur le total des six phrases-tests utilisées, 40% des questions formées par les sujets furent agrammaticales. Dans le cas de (5a), l’exemple repris dans de nombreuses publications, 47% des questions furent mal formées. Les erreurs les plus communes étaient prioritairement (5d) et secondairement (5e), qui ne sont compatibles, ni avec (R1), ni avec (R2).11 De plus, C&N ont 10 Par exemple, Pinker (1994, 42) décrit brièvement la procédure de C&N, puis note simplement : «The children cheerfully provided the appropriate questions, and, as Chomsky would have predicted, not a single one of them came up with an ungrammatical string like Is the boy who unhappy is watching Mickey Mouse?, which the simple linear rule would have produced.». La rumeur peut ensuite se répandre. Armstrong (2003, 69) reprend apparemment les propos de Pinker (1994) sans plus de vérification (utilisant lui aussi unhappy et non happy, comme dans le texte de C&N) : «One prompt was quite complex: “Ask Jabba if the boy who is unhappy is watching Mickey Mouse;” The children easily responded: “Is the boy who is unhappy watching Mickey Mouse?” How did they know […]?». 11 Dans cinq des six phrases-tests de l’expérience, is était malencontreusement à la fois l’auxiliaire/copule contenu dans le GN sujet et l’auxiliaire/copule principal. Ainsi, (5d) ne permet pas de déterminer si l’enfant ajoute simplement is en position initiale, s’il y ajoute une copie de l’auxiliaire contenu dans le GN sujet, ou s’il y ajoute une copie de l’auxiliaire principal. Une deuxième expérience (id., 534 sq.) visant à établir quelle Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Pauvreté du stimulus et construction des questions fermées en anglais 97 observé des différences importantes entre les taux d’erreur des plus jeunes et des plus âgés des sujets. Les trente enfants étaient répartis en deux groupes de quinze (G1, G2) en fonction de leur âge : ceux du G1 étaient âgés de 3;2 à 4;7 ans (âge moyen 4;3) ; ceux du G2, de 4;7 à 5;11 ans (âge moyen 5;3). Dans le cas de (5a), C&N ont relevé 80% d’erreurs chez les enfants du G1, contre seulement 13% chez ceux du G2. En tout, le taux d’erreur fut de 62% pour le G1 contre 20% pour le G2, soit un écart statistiquement significatif, notent C&N (p.529), pour qui ces taux d’erreur pourraient être largement dus à la complexité des phrases proposées.12 L’étude de C&N suggère donc bien que les jeunes enfants anglophones ne produisent pas de séquences agrammaticales du type (2c), mais elle suggère aussi que ces enfants, jusqu’à l’âge d’environ 4;5 ans, ne construisent des interrogatives du type (2b) qu’avec beaucoup de difficultés. Cette étude n'apporte qu'un soutien très relatif à l'hypothèse suivant laquelle les jeunes anglophones utiliseraient une règle ISA, hypothèse que d'autres études tendent à invalider (§4). 2. L’ABSENCE DES DONNÉES LINGUISTIQUES INDISPENSABLES Les jeunes enfants anglophones, suivant Chomsky (1975), acquièrent une règle de formation des questions fermées, la règle (R2)/ISA, qu’ils ne devraient pourtant pas pouvoir induire de leur DLP. Il faudrait pour cela qu’ils soient exposés à des interrogatives à sujet complexe telles que (2b), mais ces dernières seraient trop rares pour qu’ils puissent y avoir accès. Il s’avère toutefois que l’on peut non seulement douter de l’absence des données indispensables dans cet exemple, mais aussi du caractère indispensable de ces données.13 Premièrement, telle que formulée au §1, (R2) ne permettrait pas de construire l’interrogative Does she work? à partir de la déclarative She works. Dans l’analyse générative des questions fermées, c’est en fait la tête flexionnelle de la phrase – le noyau T du syntagme noté TP (Tense Phrase) ou IP (Inflection Phrase) en anglais, ci-dessous «GT» – qui est déplacée devant le GN sujet, plutôt que l’auxiliaire (ou copule) principal, à proprement parler. Si le GT de la structure déclarative sous-jacente contient un auxiliaire, ce dernier est combiné à la flexion et la forme résultante «monte» en position de «complémenteur» (C), stratégie est mise en œuvre par l’enfant n’a donné que des résultats très limités et difficilement interprétables. Par ailleurs, MacWhinney (2004, 890) note que la procédure de C&N a pu inciter les enfants à répéter le GN sujet tel quel dans la question construite, par imitation, et il voit là «[a] serious methodological limitation». 12 Selon C&N (id., 532), les sujets de l’expérience ont commis des erreurs de performance dues à la complexité des phrases qui leur étaient soumises et en particulier à la complexité des GN sujets. Les auteurs ont relevé des différences statistiques importantes dans les taux d’erreur qui semblent corrélées au degré de complexité du GN sujet. 13 Pour certains auteurs, la règle ISA serait de toute façon inapprenable, quel que soit le stimulus linguistique : «no amount of positive evidence, ‘exotic’ or not, would suffice» (Lasnik & Uriagereka 2002, 148). Voir aussi Laurence & Margolis (2001) et Cowie (2003). Un tel constat, pensons-nous, devrait prioritairement inciter à s’interroger quant à la plausibilité psychologique de la règle postulée (cf. §4). Downloaded from Brill.com06/13/2020 08:20:15AM via free access
98 Jérôme Puckica suivant un mouvement de T à C. Dans le cas contraire, seule la marque flexionnelle est déplacée, mais celle-ci étant une forme liée qui requiert un hôte approprié, l’auxiliaire «vide» do serait alors inséré et fusionné avec elle, doAUX n’étant donc pas lui-même déplacé.14 C’est cette règle d’inversion «sujet-flexion» que l’enfant anglophone est en fait supposé acquérir. Nous continuerons, par simplicité, de parler de règle ISA ou (R2), mais il demeure que si l’on adopte l’analyse générative, alors la classe des données indispensables dans cet exemple devrait être élargie à toute phrase ou proposition qui présente une inversion sujet- auxiliaire (ou copule) et dont le GN sujet contient un verbe fini, auxiliaire ou lexical. Les données indispensables devraient ainsi inclure, outre des phrases du type (2b), des interrogatives fermées telles que (6a), mais aussi des interrogatives ouvertes telles que (6b-d), comme le suggèrent aussi Pullum & Scholz (2002), voire même des déclaratives telles que (6e) : (6a) Can a person who works go on holiday? (6a’) {a person who works can go on holiday} (6a”) *Does a person who work can go on holiday? (6b) Where’s the money that she gave you? (6b’) {the money that she gave you is where} (6b”) *Where did the money that she give you is? (6c) How safe is the air we breathe? (6d) When will the problems she pointed out be discussed? (6e) Here is the book that she lent me. (6e’) {the book that she lent me is here} (6a) est une interrogative fermée dont le GN sujet (a person who works) contient une forme finie d’un verbe qui n’est pas un auxiliaire. L’hypothétique structure sous-jacente serait, en simplifiant, (6a’), où works précède can. L’initialisation du premier élément flexionnel (plutôt que de la tête flexionnelle) donnerait a priori (6a”), qui est agrammaticale. Par suite, (6a) devrait faire partie des données pertinentes. De même, l’interrogative ouverte (6b) présente une inversion sujet-copule. Sa structure sous-jacente simplifiée serait (6b’) et l’initialisation du premier élément flexionnel devrait donner la séquence agrammaticale (6b”). Des phrases telles que (6e) pourraient également compter parmi les données pertinentes si l’on postule une structure sous-jacente (6e’). Outre le problème de l’identification des données linguistiques supposées indispensables, se pose celui de leur présence dans les DLP. Les interrogatives fermées du type (2b) semblent bien être essentiellement inaccessibles aux jeunes enfants anglophones, comme l’avait spéculé Chomsky (1975). Legate & Yang (2002), ci-après «L&Y», n’en ont trouvé aucun exemple dans leur analyse des corpus «Nina» et «Adam» de la base de données CHILDES.15 MacWhinney 14 Voir notamment Haegeman & Guéron (1999, 92-93) ou Radford (2004, 140-44). 15 CHILDES (Child Language Data Exchange System) est une large base de données pour l’étude de l’acquisition du langage, qui contient en particulier des transcriptions de conversations entre des enfants et leurs parents ou d’autres adultes s’occupant d’eux (cf. http://childes.psy.cmu.edu). Le corpus «Nina» (46 499 phrases, 20 651 questions, selon les décomptes de L&Y) est constitué de 52 fichiers (52 heures d’enregistrement), avec des fichiers numérotés de 1 à 56 mais quatre sont manquants ; l’âge de Nina est 1;11.16 pour Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Pauvreté du stimulus et construction des questions fermées en anglais 99 (2004, 890) déclare quant à lui n’en avoir trouvé qu’un seul exemple sur environ 3M d’énoncés dans une recherche de cette même base de données, que l’auteur estime bien représentative des DLP des enfants anglophones jusqu’à l’âge de 5 ans. En revanche, la situation est plus confuse pour ce qui est des interrogatives ouvertes telles que (6b). Pour Pullum & Scholz (2002, 44), ces énoncés «seem quite common, and offer [two-year-olds] an excellent chance to see that complex NP’s invert with auxiliaries just as simple NP’s do». De même, MacWhinney (id.) note qu’il y a des centaines d’interrogatives de ce type dans CHILDES et qu’elles sont très fréquentes dans les DLP des jeunes anglophones («highly frequent in the input to children»). Cependant, L&Y n’en ont trouvé que quelques occurrences dans les deux corpus qu’ils ont étudiés et estiment, par extrapolation, que leur fréquence dans les DLP est insuffisante pour permettre l’apprentissage de la règle ISA avant 3;2 ans (l’âge du plus jeune sujet de l’expérience de Crain & Nakayama 1987). Suivant l’argumentation de L&Y, il faudrait que la fréquence de ces interrogatives soit comparable à celle des THERE-sentences (ex. There is a problem), car ces dernières impliqueraient une règle qui est également maîtrisée vers 3 ans, et qui fait bien l’objet d’un apprentissage. L&Y calculent que la fréquence des THERE-sentences est nettement plus forte et concluent que la règle ISA est acquise avant 3;2 ans sans pouvoir être apprise.16 On notera toutefois, d’une part, que les corpus Nina et Adam contiennent plus d’exemples pertinents que n’en décomptent les auteurs. Selon L&Y (p.157), le corpus Nina ne contient que 14 interrogatives du type (6b), dont ils donnent la liste complète par souci de clarté ; ce corpus est accessible en ligne et on peut y relever jusqu’à 12 autres interrogatives du même type.17 Pour le corpus Adam, L&Y (p.158) le premier et 3;3.21 pour le dernier. Le corpus Adam (20 372 phrases, 8 889 questions, selon L&Y) est constitué de 55 fichiers ; l’âge de Adam est 2;3.04 pour le premier et 5;2.12 pour le dernier. 16 Selon L&Y, la fréquence des THERE-sentences dans les DLP des jeunes anglophones jusqu’à l’âge de 3 ans est d’environ 1,2% (chiffre obtenu par les auteurs à partir d’un échantillon arbitraire de 11 214 phrases de CHILDES prononcées par des adultes). La fréquence des phrases (6b) obtenue par L&Y à partir de leur analyse des corpus Nina et Adam est beaucoup plus faible (c. 0,068% des questions pour Nina) et déclarée insuffisante : «Not only are those frequencies far below the magic figure of 1.2 percent required to learn the correct rule by the 36th month, it [sic.] is also low enough to be considered negligible, that is, not reliably available for every human child.» (p.158). 17 Les exemples les plus clairs sont ceux où le mot en wh- est where : where is the new little train that Mommy bought for you with all the little people? (nina19) ; where's the new turtle that you got for your birthday? (nina42) ; where are the pants that daddy gave you? (nina43) ; where's the lady that would sell at the store? (nina54). Dans les huit autres exemples repérés, le mot en wh- est what ou who et joue a priori une fonction d’attribut (plutôt que de sujet, auquel cas l’exemple n’est pas pertinent) : what's this he's carrying in his hand? (nina16) ; what's the animal that eats nuts? (nina27) ; what is that that you're going to feed her? (nina31) ; who was that nice man that we met on the airplane wearing a fancy hat? (nina32) ; who's that that you just took out? (nina42) ; who are these two little girls that came over to Nina's house for breakfast? (nina55) ; who's the one who's always asking questions? (nina56) ; what's that that you just put in? (nina56). Downloaded from Brill.com06/13/2020 08:20:15AM via free access
100 Jérôme Puckica n’ont trouvé que 4 exemples, tous également cités ; on peut en trouver jusqu’à 20 supplémentaires.18 De plus, L&Y ne comptabilisent pas les phrases du type (6e), dont on peut relever au moins 9 exemples dans le corpus Nina et 5 dans le corpus Adam. D’autre part, il n’existe pas nécessairement de corrélation simple entre la fréquence d’occurrence d’une structure dans les DLP et l’âge auquel la structure concernée paraît acquise dans les productions des enfants. Par exemple, les déterminants et les quantificateurs sont très fréquents dans les DLP, mais ne sont maîtrisés que relativement tard, comme le notent Clark & Lappin (2010, 38). De fait, L&Y proposent d’utiliser un étalon comparatif, mais le choix des THERE- sentences peut laisser dubitatif, d’autant qu’il paraît d’emblée évident que leur fréquence en discours ne peut être que largement supérieure à celle des phrases du type (2b) ou (6b). Enfin, un très faible pourcentage d’une somme énorme peut représenter une quantité considérable. Le corpus Nina, par exemple, ne couvre dans sa totalité que 52 heures d’échanges entre Nina et sa mère (ou parfois d’autres adultes), soit, pour arrondir, une vingtaine de questions du type (6b) en 52 heures. On ne peut que spéculer quant au nombre de questions de ce type auquel Nina aura pu être exposée avant l’âge de 3;2 ans, mais plusieurs centaines ne semblerait pas un nombre excessif : peut-on être certain qu’une telle exposition serait insuffisante ? Bref, même à supposer que les jeunes anglophones acquièrent effectivement une règle ISA, que les phrases des types (2b) et (6b) soient indispensables pour pouvoir l’apprendre et que la fréquence de ces phrases dans leur DLP avant 3;2 ans soit proche de celle avancée par L&Y, la pauvreté du stimulus en la matière paraîtrait encore loin d’être incontestablement établie. Le deuxième point, plus général, concerne le caractère supposé indispensable de certaines données linguistiques pour rendre compte d’une acquisition. Si l’on peut identifier précisément la source de certaines connaissances lexicales – l’acquisition d’un mot M requiert a priori d’être exposé au moins à une occurrence de M –, il n’en va pas aussi aisément pour des aptitudes grammaticales beaucoup plus générales. L’aptitude à construire des questions fermées, y compris du type (2b), est un savoir-faire dont les composants habituellement mentionnés (GN sujet, auxiliaire principal, «inversion») pourraient être induits d’une multitude de sources. Pour cette raison, il semble difficile de désigner un type de phrase particulier comme constituant une condition individuellement nécessaire à l’acquisition de cette aptitude. Dans les présentations de l’exemple classique de l’APSF, on demande typiquement comment l’enfant anglophone âgé d’environ trois ans parvient à construire des interrogatives du type (2b), ce qu’il ne fait en réalité qu’avec beaucoup de difficultés (cf. §1), alors qu’il n’a été exposé qu’à des interrogatives élémentaires telles que (1b), ce qui n’est évidemment pas le cas. De l’intégralité des données 18 Parmi ces exemples supplémentaires : when was the last time you saw it? (adam03) ; where is the cowboy that wears boots? (adam06) ; what's that it's got on? (adam07) ; what was that you did? (adam09) ; what is that that you're writing on? (adam10) ; what were the magic words that Ursula said? (adam16) ; what was that word you said? (adam18). Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Pauvreté du stimulus et construction des questions fermées en anglais 101 linguistiques auxquelles l’enfant a pu être exposé, ces présentations ne sembleraient presque retenir que des couples de phrases tels que The girl is happy / Is the girl happy?.19 Bien entendu, l’expérience linguistique du jeune enfant est immensément plus riche. Toute l’expérience linguistique de l’enfant, peut-on penser, couplée à des aptitudes générales d’association, de généralisation, d’abstraction, de catégorisation, de hiérarchisation et, entre autres, à un sens aigu des probabilités, l’amène à induire des structures qui reflètent des régularités dans l’organisation des énoncés linguistiques auxquels il est exposé. Il est par exemple possible, comme le note O’Grady (2008, 156-157), que les enfants anglophones ne produisent jamais de phrases telles que *Are Americans who _ rich are happy too?, qui est une interrogative du type (2b), parce que [Americans who _ rich] est une séquence mal formée, soit donc pour des raisons indépendantes du problème de la construction des questions. C’est aussi ce que suggèrent Reali & Christiansen (2005). Dans une série de simulations informatiques, ces derniers ont d’abord utilisé des modèles statistiques simples qui permettent de prédire la probabilité d’occurrence d’un mot-forme après un autre (bigram model) ou deux autres (trigram model). Les auteurs ont entraîné leurs modèles avec le corpus de Bernstein-Ratner (1984), un corpus d’énoncés adressés par neuf mères à leurs enfants âgés de 1;1 à 1;9 ans (10 705 phrases, 35 505 mots), corpus qui ne contenait aucune interrogative fermée à sujet complexe du type (2b). Après cet entraînement, 100 paires de questions-tests formées avec des mots du corpus ont été soumises aux modèles, chaque paire comprenant une interrogative du type (2b) et sa correspondante agrammaticale du type (2c), ex. {Is the lady who is there eating? ; *Is the lady who there is eating?}. Pour chaque paire, les modèles devaient déterminer laquelle des deux séquences était la plus probable ; si la plus probable des deux était la phrase grammaticale, alors la phrase était dite correctement classée. Ces modèles se sont montrés capables de distinguer les interrogatives bien formées du type (2b) des interrogatives mal formées du type (2c) dans 96% des cas, i.e. l’interrogative bien formée a été correctement classée dans 96% des cas. Les auteurs ont ensuite répété la procédure avec des réseaux connexionnistes du type SRN (Simple Recurrent Network). Ils ont entraîné ces réseaux avec le même corpus, si ce n’est que chaque mot du corpus a été remplacé par une information catégorielle, l’input se réduisant ainsi à des séquences du type [DET N V PREP DET N] en place de [the plates are in the kitchen], par exemple.20 Comme catégorie pouvant faire suite à une séquence du type [V DET N PRN] (ex. Is the boy who/that…), les 19 C’est, entre autres, l’impression que peut donner l’extrait ci-dessous de Collins (2003, 168, italiques ajoutés), où «(1)» est That man is happy, «(2)» Is that man happy?, «SD» est une règle dépendante de la structure du type (R2) et «SI» une règle indépendante de la structure du type (R1) : «Now if we assume that the child only has the data recorded in (1)+(2) to go on, then she appears to make a massive leap to the auxiliary inversion rule SD. After all, SI predicts the pattern in (1)+(2), so if the child had no antecedent information on phrasal structure, why on earth should she opt for the complex and particular rule SD?». 20 Les auxiliaires étaient étiquetés «V». Voir Reali & Christiansen (id., 1019) pour une présentation plus détaillée. Downloaded from Brill.com06/13/2020 08:20:15AM via free access
102 Jérôme Puckica réseaux ont tous montré une préférence très marquée pour V (cf. Reali & Christiansen, id., 1019-1020). Trente des 100 phrases-tests de l’expérience précédente ont été soumises aux réseaux et 90% ont été correctement classées. Pour Reali & Christiansen (2005), les réseaux SRN peuvent être utilisés comme modèles psychologiques de l’apprentissage humain et les résultats obtenus suggèrent que le stimulus linguistique auquel sont exposés les jeunes enfants anglophones, même s’il est totalement dépourvu d’interrogatives du type (2b), pourrait être suffisamment riche pour leur permettre d’apprendre comment construire des interrogatives du type (2b). Il contiendrait, selon les termes des auteurs, suffisamment de données ou «preuves statistiques indirectes» (indirect statistical evidence) de la construction considérée.21 Les auteurs ne semblent malheureusement pas avoir considéré le cas des interrogatives ouvertes du type (6b-d), dont rien n’est dit. Par ailleurs, leur méthode a été critiquée par Kam et al. (2008), dont l’étude suggère également qu’un modèle statistique simple du type bigram model ne donne que des résultats très mitigés lorsqu’il est testé avec des questions plus complexes ou dont le GN sujet contient d’autres types de relative (par exemple, des relatives «zéro» comme dans the lady you met). Les résultats de Reali & Christiansen (2005) invitent néanmoins à se méfier de la notion de données linguistiques indispensables lorsqu’il s’agit de rendre compte de l’acquisition de compétences grammaticales relativement générales ; il convient plutôt de tenter de considérer ce que peut être l’expérience linguistique des jeunes enfants de façon plus globale. Cette étude peut être mise en relation avec les divers travaux qui ont mis en avant l’importance des apprentissages statistiques fondés sur des régularités distributionnelles (cf. Romberg & Saffran 2010), par exemple sur des probabilités de transition entre éléments adjacents (Saffran et al. 1996), ou encore sur ce que Saffran (2001) nomme des «dépendances prédictives», i.e. sur le fait que les propriétés dépendancielles des items linguistiques permettent d’effectuer des inférences : par exemple, en anglais, un article est normalement suivi d’un nom – directement, le plus souvent – et l’article a est plus précisément suivi d’un nom dénombrable singulier ; une préposition tend à être suivie d’un GN, tel verbe tend à être suivi de tel type de complément, etc. Ces notions sont également centrales dans l’approche constructionnelle du savoir-faire linguistique esquissée au §4. De tels indices distributionnels permettraient un début d’analyse syntagmatique des énoncés selon Saffran (2001) et d’autres indices sont vraisemblablement exploités à cette fin, d’ordre sémantique ainsi que d’ordre prosodique («prosodic bootstrapping») et plus généralement phonologique (cf. Morgan & Demuth 1996, Höhle 1999, Jusczyk 2003, Ambridge & Lieven 2011, 13 sq.). A nouveau, il convient ici de considérer le stimulus linguistique dans toutes ses dimensions et dans toute sa richesse. 21 Cf. Reali & Christiansen (2005, 1022) : «The corpus analyses indicate that there is sufficiently rich statistical information available indirectly in child-directed speech for making appropriate generalizations about complex AUX questions. Therefore, our results challenge the classic notion of evidence in the primary linguistic input, which presupposes that only explicit examples of a certain grammatical construction constitute useful evidence for its correct generalization […].» Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Pauvreté du stimulus et construction des questions fermées en anglais 103 3. LE PRINCIPE DE DÉPENDANCE STRUCTURALE ET LA FACULTÉ DE HIÉRARCHISATION Suivant l’argumentation présentée au §1, les enfants anglophones acquérraient une règle de formation des questions du type (R2)/ISA, car GU, le «composant génétique» de FL, contiendrait un principe de dépendance structurale qui stipule que toutes les règles grammaticales, dont les règles transformationnelles, font référence à l’organisation hiérarchique des phrases. En fait, certaines règles grammaticales, du moins morpho-phonologiques, sont purement linéaires : par exemple, en anglais, les règles d’allomorphie de l’article indéfini (ex. a book, an apple) ou du prétérit régulier (ex. worked [-t], loved [-d], blended [-ɪd, -əd]). Toutefois, ce qui importe surtout ici est que l’on peut douter de la nécessité de reconnaître un principe de dépendance structurale inscrit dans GU, autrement dit, du fait que l’exemple classique de l’APSF requiert l’hypothèse de GU/FL. Tel que défini ci-dessus, le principe de dépendance structurale présuppose une grammaire de règles, incluant des règles transformationnelles, dont la plausibilité est discutable (cf. §4). En revanche, il ne fait pas de doute qu’une phrase est plus qu’une simple suite de mots et que les expressions linguistiques composites tendent à présenter une organisation interne plus ou moins hiérarchisée. Dans une perspective ascendante (synthétique) plutôt que descendante (analytique), cela revient à dire que deux structures peuvent être combinées pour former une unité plus complexe à un niveau supérieur d’organisation, par exemple, deux phonèmes formant une syllabe ou deux mots formant un syntagme. Cette opération fondamentale de construction est diversement nommée fusion (ex- «Merge», désormais «external Merge» dans la grammaire chomskyenne), unification (dans les grammaires d’unification), ou encore intégration (dans la grammaire cognitive de Langacker).22 La reconnaissance de cette opération, toutefois, n’implique pas celle d’un module cognitif autonome spécifiquement dédié au langage. En effet, l’intégration est une forme de hiérarchisation et pourrait n’être qu’une application particulière, dans le domaine du langage, d’un principe cognitif général. Comme l’écrit Langacker (1987, 310) : Hierarchy is fundamental to human cognition. Cognitive processing involves multiple levels of organization, such that elements at one level combine to form a complex structure that functions as a unitary entity at the next higher level, and so on. Prominent among the linguistically relevant hierarchies are those defined by successive integration of symbolic structures in valence relations. The same hierarchical organization can be observed whether we consider semantic, phonological, or symbolic structures. L’organisation hiérarchique des structures linguistiques s’observe dans les langues parlées, mais aussi, quoique de façon parfois plus discutée, dans les 22 La reconnaissance d’une organisation hiérarchisée des phrases est tout aussi centrale dans les grammaires syntagmatiques qu’elle l’est dans les grammaires de dépendances, comme la syntaxe structurale de Tesnière (1959) ou la Word Grammar de Hudson (1984), qui ne reconnaît aucun rôle théorique à la notion de syntagme. Downloaded from Brill.com06/13/2020 08:20:15AM via free access
104 Jérôme Puckica langues signées (Sandler & Lillo-Martin 2006, Perniss et al. 2007). Que l’on considère l’organisation du monde physique, biologique ou même social, les hiérarchies semblent en fait omniprésentes (Pumain 2006). Le système visuel humain, par exemple, est éminemment hiérarchisé : on peut reconnaître une multitude de niveaux d’organisation de l’information, allant de celui des cellules photo-réceptrices situées sur la rétine, au cortex cérébral et à l’émergence d’une représentation visuelle complexe, qui présente elle-même une organisation hiérarchique. On peut également reconnaître ce type d’organisation dans le domaine de la musique, par exemple dans les accords et les progressions harmoniques (Patel 2003), mais aussi dans de nombreuses activités motrices complexes (Lashley 1951), dont l’assemblage manuel d’objets physiques (Greenfield 1991). Une autre illustration bien connue en psychologie est l’opération dite de chunking («(re)groupement»). Dans un article de 1956 devenu un classique, «The magical number seven, plus or minus two», le psychologue américain G.A. Miller proposait que notre mémoire de travail (à court terme) ne peut en moyenne traiter simultanément que 7 2 unités d’information. Ce chiffre peut sembler quelque peu élevé, mais la proposition de Miller expliquerait néanmoins une tendance naturelle à «recoder» l’information en organisant des regroupements (chunks) qui permettent de réduire une liste d’items relativement longue. Ou, comme le remarque Comrie (2003, 200) : «Human cognition requires structure in order to be able to work with strings consisting of more than a few items.» Par exemple, alors qu’un numéro de téléphone (ou de sécurité sociale, etc.) n’est qu’une séquence linéaire de chiffres, on impose naturellement, presque inévitablement, une structure à cette séquence pour en faciliter la mémorisation et la manipulation mentale (ex. 04-65-54-78-78 ou 0-465-54-7878 plutôt que 0-4-6-5-5-4-7-8-7-8). Une séquence relativement longue d’unités simples est transformée en une séquence plus courte d’unités plus complexes. De même, il est aisé de mémoriser la séquence C-G-T-A-D-N-O-M-S en effectuant les regroupements CGT-ADN-OMS. La structuration hiérarchique apparaît ici comme une stratégie qui permet de compenser l’empan limité de notre mémoire de travail, soit de faciliter le traitement cognitif de l’information. Pour Edelman (2008, 30), l’«abstraction hiérarchique» est au «cœur de l’esprit» et l’organisation hiérarchique des expressions linguistiques est liée à ce principe cognitif fondamental (id., p.288). Les études neuropsychologiques semblent confirmer l’hypothèse d’une faculté transversale de hiérarchisation et même s’accorder quant à la localisation de ce qui pourrait être son centre. Ainsi, Tettamanti & Perani (2012) mentionnent plusieurs études ayant utilisé des techniques d’imagerie cérébrale dont les résultats suggèrent que l’aire de Broca, connue pour son implication dans le traitement du langage, pourrait avoir un rôle central dans le traitement de diverses formes de hiérarchisation, d’ordre linguistique et non-linguistique. Elle pourrait constituer un «processeur hiérarchique supramodal» (Tettamanti & Weniger 2006) commun à diverses fonctions cognitives. Dans une revue récente des travaux sur la question, Jeon (2014) évoque de même une convergence de données expérimentales indiquant que l’aire 44 de Brodmann, où se trouve en partie l’aire de Broca, pourrait Downloaded from Brill.com06/13/2020 08:20:15AM via free access
Vous pouvez aussi lire