Recherches sur l'Echelle d'acquisition de l'orthographe lexicale

L'échelle Dubois-Buyse regroupe 3787 mots d'usage courant.

L'intérêt de cette Echelle réside dans le fait que la maîtrise orthographique de ses mots, choisis pour leur très fréquente utilisation dans les écrits spontanés, a été testée sur un échantillon très important.

Ces mots sont regroupés en 2 catégories :
- les mots-outils ("0" dans la rubrique "échelon" et "Outil" dans la rubrique "Niveau") qui représentent à eux seuls environ 40% du vocabulaire écrit courant,
- les autres mots étalonnés en degrés de difficulté, les échelons (exemple : les enfants sont censés acquérir en CP les mots des échelons 1 à 9).
Vous pouvez rechercher un échelon précis ou travailler sur un intervalle.

Une rubrique dans laquelle vous laissez au moins un champ avec la valeur "Indifférent" ne sera pas prise en compte dans le tri des mots.

 

Quelques mots ont été ajoutés à la Base de Données (Echelon = 100) du fait de leur fréquence d'apparition qui semble justifier leur ajout.
Cette Base de Données regroupe ainsi 4000 mots.
Vous pouvez rechercher un mot précis ou une chaîne de caractères (auquel cas tous les mots la contenant vous seront renvoyés).

 

 

La rubrique "Niveau" indique à quel niveau de scolarité l'enfant est censé acquérir l'orthographie du mot.
Vous pouvez faire des recherches sur des intervalles mais uniquement dans la fourchette CP-CM2.

 

 

Dans cette Base de Données, chaque mot a fait l'objet d'un comptage dans un corpus de textes de type informatif (Les "Clés de l'Actualité") de 100 000 mots.
La rubrique "Fréquence" indique pour chaque mot le nombre de fois, sur 10 000 mots, où il a été rencontré dans ce texte, sous forme déclinée ou non (noms et adjectifs), conjuguée ou non (verbes).
L'Echelle reprend 79% du corpus avec ses 3787 mots.

 

 

La rubrique "Nature" indique les différentes natures possibles du mot (PRO = pronom, NOM = nom, ADJ = adjectif, PRE = préposition, ADV = adverbe, VER = verbe, DET = Déterminant).

 

 

La rubrique "Phonétique" indique les phonèmes composant le mot. Ces sons sont "codés" par "mots-clés" :
sons-voyelles : rat ([a]), rue, il, col, peur, jeu, mou, dé, mère, do, dans, mon, un, main, moins, moi,
sons-consonnes : du, je, zéro, cri, pas, te, se, fou, chat, fille, garçon, ligne, vache, taxi, exact, ma, ne, roi, le.
ATTENTION : les phonèmes (et davantage encore les mots-clés) sont propres à cette base de données, ils ne correspondent que partiellement à l'Alphabet Phonétique International.
Il est possible de rechercher des phonèmes en fonction de leur position dans le mot, la position du "milieu" étant définie par le fait que le phonème recherché n'est ni en première ni en dernière position.
NE PAS OUBLIER DE CLIQUER SUR UN SON.

 

 

La rubrique "Correspondance grapho-phonétique" indique la façon dont chaque son du mot est écrit.
On peut, par exemple, demander la liste des mots dont le son [moi] final s'écrit "oix".
NE PAS OUBLIER DE CLIQUER SUR UN SON.

 

 

En croisant ces différentes rubriques, il est possible de multiplier les critères de tris en fonction de vos besoins.
De même, une fois maîtrisée la manipulation des critères de tri, avec ses codages spécifiques, toutes sortes d'études statistiques sont possibles.