« Statistiques » : différence entre les versions

De Disposition de clavier bépo
Aucun résumé des modifications
(Ajout d'un tableau)
Ligne 1 : Ligne 1 :
Préparatifs : Pour optimiser le processus, on fait un dump d'un des dictionnaires venant d'aspell :
__TOC__
 
==Obtention via Aspell==
Préparatifs : Pour optimiser le processus, on fait un dump d'un des dictionnaires venant d'aspell :
  $ aspell dump master fr > dump-fr.txt
  $ aspell dump master fr > dump-fr.txt
  $ wc -l dump-fr.txt
  $ wc -l dump-fr.txt
Ligne 30 : Ligne 33 :
  15: 7
  15: 7


==Statistiques==
En résumé :
En résumé :
* avec auiestrn, soit la rangée de base du bépo :
* avec auiestrn, soit la rangée de base du bépo :
Ligne 46 : Ligne 50 :
** Méthode 2 : ?
** Méthode 2 : ?
** Méthode 3 : 23,1 - 63,8 %
** Méthode 3 : 23,1 - 63,8 %
{| class="wikitable" border="1"
|-
| Corpus || Test (dans la rangée de repos) || bépo || Leboutte || Dvorak-us || azerty || qwerty
|-
| rowspan=2 | Aspell-fr || Nombre de résultats || 4255 || ? || 813 || 6 || 35
|-
| Mot le plus long (nombre) || 15 (7) || ? (?) || 15 (1) || 2 (6) || 7 (1)
|-
| Thomas Trempé || Pourcentage de frappes || 61,7 % || ? || ? || 21,9 % || ?
|-
| Nicolas C. || Pourcentage de frappes || 62 % || ? || ? || 22 % || ?
|-
| [http://www.apprendre-en-ligne.net/crypto/stat/francais.html apprendre-en-ligne.net] || Pourcentage de frappes || 67,57 % || ? || ? || 23,7 % || ?
|-
| rowspan=3 | [http://www.lexique.org/listes/liste_lettres.php lexique.org] || Pourcentage de frappes (méthode 1) || 61,1 % || ? || ? || 22,1 % || ?
|-
| Pourcentage de frappes (méthode 2) || ? || ? || ? || ? || ?
|-
| Pourcentage de frappes (méthode 3) || 63,8 % || ? || ? || 23,1 % || ?
|}

Version du 28 septembre 2008 à 13:36

Obtention via Aspell

Préparatifs : Pour optimiser le processus, on fait un dump d'un des dictionnaires venant d'aspell :

$ aspell dump master fr > dump-fr.txt
$ wc -l dump-fr.txt
629569 dump-fr.txt

Donc, on part sur la base de 629 569 entrées (Il y a des mots, mais aussi des abbréviations et possiblement quelques sigles).

Via awk ou egrep et quelques expressions rationnelles, on sélectionne les touches qui nous intéressent :

$ awk '/^[auiestrn]*$/' dump-fr.txt | wc -l
4255

Ce qui nous fait 4255 entrées pour la rangée de base du bépo.

Pour obtenir le nombre de mots en fonction du nombre de lettres :

$ awk '/^[auiestrn]*$/' dump-fr.txt |\
  perl -e '$word{-1+length $_}++ while (<STDIN>);\
  print "$_: $word{$_}\n" foreach sort {$a <=> $b} keys %word;'
1: 1
2: 26
3: 63
4: 150
5: 313
6: 497
7: 632
8: 686
9: 672
10: 523
11: 357
12: 204
13: 93
14: 31
15: 7

Statistiques

En résumé :

  • avec auiestrn, soit la rangée de base du bépo :
    • on a 4255 résultats, soit un peu moins de 7% de la totalité du dictionnaire. On obtient 7 mots de 15 lettres.
    • La fréquence totale de ces 8 caractères représentent 62% de la fréquence de tous les caractères (29% pour gsdfjklm) Nemolivier
  • avec qsdfjklm, la rangée de base de l'azerty, on a 6 résultats, qui sont des unités (km, mm, ms, ml, dm et dl).
  • avec asdfjkl, soit en qwerty, 35 résultats. On a un résultat avec 7 lettres, ce qui est le maximum.
  • avec aoeuhtns, en dvorak-us, 813 résultats, soit un peu plus de 1% du dictionnaire, et un résultat de 15 lettres.

Frappe dans la rangée de repos qsdfjklm - auietsrn :


Corpus Test (dans la rangée de repos) bépo Leboutte Dvorak-us azerty qwerty
Aspell-fr Nombre de résultats 4255 ? 813 6 35
Mot le plus long (nombre) 15 (7) ? (?) 15 (1) 2 (6) 7 (1)
Thomas Trempé Pourcentage de frappes 61,7 % ? ? 21,9 % ?
Nicolas C. Pourcentage de frappes 62 % ? ? 22 % ?
apprendre-en-ligne.net Pourcentage de frappes 67,57 % ? ? 23,7 % ?
lexique.org Pourcentage de frappes (méthode 1) 61,1 % ? ? 22,1 % ?
Pourcentage de frappes (méthode 2) ? ? ? ? ?
Pourcentage de frappes (méthode 3) 63,8 % ? ? 23,1 % ?