Étude de la variation sur les mots et les pseudo‑mots dans la dictée IVQ : le choix des scripteurs

Carole Blondel, Catherine Brissaud et Fanny Rinck

Citer cet article

Référence électronique

Carole Blondel, Catherine Brissaud et Fanny Rinck, « Étude de la variation sur les mots et les pseudo‑mots dans la dictée IVQ : le choix des scripteurs », Langues et recherche [En ligne], mis en ligne le 15 novembre 2023, consulté le 28 avril 2024. URL : https://www.languesetrecherche.fr/129

Pour analyser plus en détail les réponses erronées des scripteurs, nous avons relevé pour chaque population, le nombre de variantes produites pour chaque mot et pour chaque pseudo-mot (voir section 1). Nous essayons ainsi de voir s’il existe des différences dans les choix graphiques, entre les enquêtés « bas » et les enquêtés « haut ». Pour les mots, le nombre de variantes représente le nombre de formes différentes proposées qui ne respectent pas la norme orthographique : par exemple les graphies *épiceri, *ipisiri représentent deux variantes de épicerie. Nous avons neutralisé les marques de morphologie, en considérant comme une seule variante les formes qui ne diffèrent que d’une marque de nombre (ex. *épiceri, *épiceris = une variante de *épiceri) ou d’une marque de genre (ex. *fiancé, *fiancée = une variante de *fiancé). L’analyse de la morphologie est effectuée indépendamment de l’analyse lexicale. Pour les pseudo-mots, le nombre de variantes représente le nombre de formes proposées qui respectent la forme phonographique attendue : par exemple les graphies micatol, micatole représentent deux variantes de /mikatɔl/.

Nous indiquons pour chaque mot et pseudo-mot, le nombre de réponses erronées (c’est-à-dire qui ne restituent pas la forme orthographique du mot et la forme phonographique du pseudo-mot). Cette information permet d’interpréter les résultats et de se rendre compte de la récurrence des formes proposées. En effet, l’indication du nombre de variantes (sans l’indication du nombre de réponses erronées) ne permet pas de rendre compte de la récurrence des réponses : par exemple, les enquêtés « bas » qui ne connaissaient pas l’orthographe de sel ont proposé 8 graphies différentes de ce mot (ex. *cel, *sell, *sl) alors que pour pharmacie, 19 variantes ont été relevées. L’indication du nombre d’erreurs (9 erreurs pour sel et 25 pour pharmacie) nous permet de constater que si les réponses erronées proposées pour sel ne sont pas récurrentes, elles le sont davantage pour pharmacie.

Pour pouvoir comparer la variation dans les deux corpus, le nombre de réponses erronées est ramené à un pourcentage calculé en fonction du nombre total de réponses.

Variation observée sur les mots

Nous présentons dans le tableau 2, la variation observée sur chaque mot de la dictée IVQ pour les enquêtés « bas » et « haut ». Les items sont présentés selon leur ordre d’apparition dans la dictée.

Tableau 2. Relevé de la variation sur les mots, observée d’après les réponses erronées dans les deux corpus

mots

nombre de variantes enquêtés ‘bas’

réponses erronées

enquêtés ‘bas’

nombre de variantes enquêtés ‘haut’

réponses erronées enquêtés ‘haut’

pharmacie

19

25 (24 %)

1

1 (1 %)

anti

19

45 (43 %)

1

2 ( 2%)

rhume

15

50 (48 %)

4

13 (15 %)

alcool

22

38 (36 %)

2

4 (5 %)

épicerie

29

35 (35 %)

2

2 (2 %)

tomate(s)

8

10 (9 %)

0

0

pays

10

27 (29 %)

2

4 (5 %)

confiture

10

10 (9 %)

0

0

cerise(s)

20

33 (32 %)

4

4 (5 %)

sel

8

9 (8 %)

0

0

fromage(s)

9

12 (11 %)

0

0

sente(nt)

13

22 (22 %)

1

1 (1 %)

fort

9

20 (19 %)

1

1 (1 %)

librairie

27

44 (43 %)

2

6 (7 %)

fiancé

29

48 (46 %)

8

8 (9 %)

solennel

37

87 (82 %)

10

42 (48 %)

Lorsque les enquêtés du module bas ne connaissent pas l’orthographe d’un mot, la variation peut être très importante, notamment sur les mots de la dictée qui sont les moins fréquents (ex. solennel) ou les moins réguliers (ex. rhume, fiancé). Les erreurs peuvent porter sur toutes les correspondances phonie-graphie, ce qui multiplie les possibilités de graphie (ex. *fillancé, *fioncé, *fiencé, *fiensé). À l’inverse, même lorsque les erreurs sont importantes chez les enquêtés « haut », la variation reste peu importante. Par exemple, solennel, dont le taux d’erreurs approche les 50 % chez les enquêtés « haut », n’a été écrit que de 10 manières différentes alors que chez les enquêtés « bas » 37 graphies différentes ont été proposées.

Chez les enquêtés « haut », les erreurs sont principalement orthographiques, et portent sur une difficulté précise, ce qui limite la variation : pour librairie par exemple, les erreurs portent sur la transcription du phonème /e/ (*librerie, *librérie), le « e » muet final étant systématiquement noté. Chez les enquêtés « bas » en revanche, nous relevons également des erreurs sur le « e » muet final du suffixe « ie » (*librairi, *libreri) pour les formes qui restituent néanmoins la forme sonore du mot. Sur les autres graphies relevées, qui sont incorrectes sur le plan phonographique, nous constatons des confusions sur le phonème /b/ transcrit « p » ou « v » (*liprerie, *livreri), des omissions de phonèmes (*libairie, *librere) ainsi que des formes qui cumulent les erreurs (*liphagi, *mipari, *epréi).

Variation observée sur les pseudo‑mots

Pour les pseudo-mots, il était attendu du scripteur qu’il transcrive la forme sonore entendue en choisissant parmi les correspondances phonie-graphie du français. Certains phonèmes acceptaient donc plusieurs graphèmes (ex. /i/ : « i », « y ») alors que d’autres ne pouvaient être transcrits que d’une seule manière (ex. /m/ à l’initiale : « m »). Dans le tableau 3, nous présentons la variation sur les formes phonographiquement acceptées pour les pseudo-mots13.

Tableau 3. Relevé de la variation sur les pseudo-mots dont la forme est phonographiquement correcte dans les deux corpus

pseudo-mots

nombre de variantes acceptées enquêtés ‘bas’

réponses acceptées enquêtés ‘bas’

nombre de variantes acceptées enquêtés ‘haut’

réponses acceptées enquêtés ‘haut’

micatole

16

87 (82 %)

8

81 (94 %)

sirape

13

90 (86 %)

9

82 (95 %)

dux

5

71 (68 %)

4

76 (92 %)

gobar

9

79 (75 %)

11

78 (90 %)

joc

15

79 (73 %)

10

78 (90 %)

pévanor

12

64 (60 %)

9

77 (89 %)

Pour les pseudo-mots, les possibilités de variantes sont importantes (choix différents de graphèmes, redoublements de consonnes, ajout de lettres muettes, segmentation). Excepté pour gobar, on trouve davantage de formes graphiques différentes chez les enquêtés « bas ». Micatole par exemple a suscité deux fois plus de propositions chez les enquêtés « bas » (16 graphies différentes contre 8 chez les enquêtés « haut »). Cela étant, on relève peu d’écart dans le nombre de réponses acceptées sur le plan phonographique dans les deux populations et les taux de réussite sur les pseudo-mots chez les enquêtés « bas » sont plus proches de ceux des enquêtés « haut » que pour les mots de la dictée IVQ14. Nous avons effectivement montré (Blondel, Brissaud, Rinck, 2016) que la prise en compte du critère phonographique sur les mots de la dictée (ex. la graphie *épisserie acceptée du point de vue phonographique) faisait augmenter de manière nette les taux de réussite, notamment sur les mots les moins bien restitués (car peu fréquents et moins réguliers). Par exemple, le taux de réussite sur solennel passe ainsi de 19 % (avec la prise en compte du critère orthographique) à 65 % (quand on ajoute la prise en compte du critère phonographique).

L’analyse des formes récurrentes proposées dans le tableau 4, nous permet de voir si les enquêtés « bas » et les enquêtés « haut » ont fait les même choix graphiques. Dans ce tableau, nous recensons les deux ou trois formes graphiques les plus fréquentes, les autres n’ayant été utilisées que par très peu de scripteurs au sein de chaque population. Pour le calcul des occurrences, nous avons neutralisé les accents pour ne compter qu’une seule variante (pevanor, pévanor, PEVANOR = pevanor) et les pourcentages indiqués entre parenthèses ont été calculés par rapport au nombre de réponses correctes.

Tableau 4. Relevé des formes récurrentes sur les pseudo-mots parmi les variantes acceptables sur le plan phonographique dans les deux corpus

enquêtés « bas »

enquêtés « haut »

micatole

micatol
(52 %)

micatole
(13 %)

mikatol
(11 %)

micatol
(57 %)

micatole
(14 %)

mycatol
(11%)

sirape

sirap
(38 %)

sirape
(26 %)

cirape
(12 %)

sirap
(50 %)

sirape
(21 %)

cirap
(10 %)

dux

dux
(62%)

duxe
(34 %)

pas d’autre forme récurrente

dux
(84%)

duxe
(13 %)

pas d’autre forme récurrente

gobar

gobar
(38 %)

gobard
(29 %)

gobare
(14 %)

gobard
53 %)

gobart
(19 %)

gobar
(13%)

joc

jock
(25 %)

joc
(22 %)

jok
(19 %)

jock
(33 %)

joc
(27 %)

jok
(13 %)

pévanor

pevanor (55 %)

pevanord (23 %)

pevanore
(9 %)

pevanor (52 %)

pevanord (29 %)

pevanore
(12 %)

Au sein de chaque population, les enquêtés ont proposé des formes graphiques similaires. Sauf pour gobar, les deux formes graphiques les plus utilisées pour chaque pseudo-mot sont les mêmes dans les deux corpus. Ainsi, lorsqu’ils doivent écrire des items qui n’ont pas d’orthographe, les deux populations ont fait les mêmes choix en utilisant des combinaisons de graphèmes similaires, qui sont sans doute les plus caractéristiques du lexique du français. On remarque en effet que pour micatol, sirap, dux et pevanor, les enquêtés ont en majorité opté pour une graphie « simple », sans ajout de lettres muettes, en utilisant des suites de graphèmes relativement stables et fréquentes (Catach, 1980). Pour joc, on peut penser que les enquêtés ont choisi la graphie jock (33 % des enquêtés « bas » et 25 % des enquêtés « haut ») pour se rapprocher d’un prénom existant, Jack.

On observe néanmoins une différence dans le choix ou non d’ajouter une lettre finale muette pour gobar. Les enquêtés « haut » ont préféré l’écrire avec une lettre finale muette « d » (53 %) ou « t » (19 %), contre 29 % de formes en « d » pour les enquêtés « bas ». Le « d » a également été choisi en priorité comme lettre finale par les deux populations dans pevanord. Pour sirape en revanche, l’ajout d’un « e » muet final est davantage privilégié par les enquêtés « bas » (38 % contre 21 % pour les enquêtés » haut »).

13 Voir la liste dans le tableau 1, p. 5.

14 Voir les figures 3 et 4, p. 7-8.

13 Voir la liste dans le tableau 1, p. 5.

14 Voir les figures 3 et 4, p. 7-8.

Carole Blondel

Université Grenoble Alpes, LIDILEM, F-38000 Grenoble, France

Articles du même auteur

Catherine Brissaud

Université Grenoble Alpes, LIDILEM, F-38000 Grenoble, France

Articles du même auteur

Fanny Rinck

Université Grenoble Alpes, LIDILEM, F-38000 Grenoble, France

Articles du même auteur