« Statistiques » : différence entre les versions

De Disposition de clavier bépo
m (→‎Distance et même main / même doigt : sur env. 100 000 car. de l'article France de Wikipédia)
(Ajout de la catégorie "Historique")
 
(2 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 2 : Ligne 2 :


==Obtention via Aspell==
==Obtention via Aspell==
Préparatifs : Pour optimiser le processus, on fait un dump d'un des dictionnaires venant d'aspell :
Préparatifs : Pour optimiser le processus, on fait un dump d’un des dictionnaires venant d’aspell :
  $ aspell dump master fr > dump-fr.txt
  $ aspell dump master fr > dump-fr.txt
  $ wc -l dump-fr.txt
  $ wc -l dump-fr.txt
  629569 dump-fr.txt
  629569 dump-fr.txt
Donc, on part sur la base de 629 569 entrées (Il y a des mots, mais aussi des abbréviations et possiblement quelques sigles).
Donc, on part sur la base de 629 569 entrées (Il y a des mots, mais aussi des abréviations et possiblement quelques sigles).


Via awk ou egrep et quelques expressions rationnelles, on sélectionne les touches qui nous intéressent :
Via awk ou egrep et quelques expressions rationnelles, on sélectionne les touches qui nous intéressent :
Ligne 37 : Ligne 37 :
En résumé :
En résumé :
* avec auiestrn, soit la rangée de base du bépo :
* avec auiestrn, soit la rangée de base du bépo :
** on a 4255 résultats, soit un peu moins de 7% de la totalité du dictionnaire. On obtient 7 mots de 15 lettres.
** on a 4255 résultats, soit un peu moins de % de la totalité du dictionnaire. On obtient 7 mots de 15 lettres.
** La fréquence totale de ces 8 caractères représentent 62% de la fréquence de tous les caractères (29% pour qsdfjklm) [[Utilisateur:Nemolivier|Nemolivier]]
** La fréquence totale de ces 8 caractères représentent 62 % de la fréquence de tous les caractères (29 % pour qsdfjklm) [[Utilisateur:Nemolivier|Nemolivier]]
* avec qsdfjklm, la rangée de base de l'azerty, on a 6 résultats, qui sont des unités (km, mm, ms, ml, dm et dl).
* avec qsdfjklm, la rangée de base de l’azerty, on a 6 résultats, qui sont des unités (km, mm, ms, ml, dm et dl).
* avec asdfjkl, soit en qwerty, 35 résultats. On a un résultat avec 7 lettres, ce qui est le maximum.
* avec asdfjkl, soit en qwerty, 35 résultats. On a un résultat avec 7 lettres, ce qui est le maximum.
* avec aoeuhtns, en dvorak-us, 813 résultats, soit un peu plus de 1% du dictionnaire, et un résultat de 15 lettres.
* avec aoeuhtns, en dvorak-us, 813 résultats, soit un peu plus de % du dictionnaire, et un résultat de 15 lettres.


Frappe dans la rangée de repos qsdfjklm - auietsrn :
Frappe dans la rangée de repos qsdfjklm - auietsrn :
Ligne 59 : Ligne 59 :
| || touches || auie tsrn || +cm || uiea trsn || +ol || oaue stnd || +bfw || aoeu htns || +id || qsdf jklm || +gh || asdf jkl || +gh
| || touches || auie tsrn || +cm || uiea trsn || +ol || oaue stnd || +bfw || aoeu htns || +id || qsdf jklm || +gh || asdf jkl || +gh
|-
|-
| rowspan=2 | Dico<br>Aspell-fr || Nombre de résultats || 4255 || 10050 || 4255 || 13405 || 976 || 1846 || 813 || 3325 || 6 || 11 || 35 || 70
| rowspan=2 | Dico<br />Aspell-fr || Nombre de résultats || 4255 || 10050 || 4255 || 13405 || 976 || 1846 || 813 || 3325 || 6 || 11 || 35 || 70
|-
|-
| Longueur maximum (nombre) || 15 (7) || 17 (5) || 15 (7) || 23 (2) || 13 (5) || 14 (2) || 15 (1) || 16 (4) || 2 (6) || 2 (11) || 7 (1) || 8 (1)
| Longueur maximum (nombre) || 15 (7) || 17 (5) || 15 (7) || 23 (2) || 13 (5) || 14 (2) || 15 (1) || 16 (4) || 2 (6) || 2 (11) || 7 (1) || 8 (1)
|-
|-
| [[Fr%C3%A9quence_des_caract%C3%A8res#Corpus_de_Thomas_Temp.C3.A9 | Thomas Trempé]] || Pourcentage de frappes || 61,7 % || || || || 57 % || || 54,2 % || || 21,9 % || || 27,8 % ||
| [[Fr%C3%A9quence_des_caract%C3%A8res#Corpus_de_Thomas_Temp.C3.A9|Thomas Trempé]] || Pourcentage de frappes || 61,7 % || || || || 57 % || || 54,2 % || || 21,9 % || || 27,8 % ||
|-
|-
| [[Fr%C3%A9quence_des_caract%C3%A8res#Corpus_de_Nicolas_C. | Nicolas C.]] || Pourcentage de frappes || 62 % || 69 % || || || 57 % || 59 % || 54,2 % || || 22 %  || || 28 % ||
| [[Fr%C3%A9quence_des_caract%C3%A8res#Corpus_de_Nicolas_C.|Nicolas C.]] || Pourcentage de frappes || 62 % || 69 % || || || 57 % || 59 % || 54,2 % || || 22 %  || || 28 % ||
|-
|-
| rowspan=3 | [http://www.lexique.org/listes/liste_lettres.php lexique.org] || Pourcentage de frappes (méthode 1) || 61,1 % || || || || 56,5 % || || 53,8 % || || 22,1 % || || 28,3 % ||
| rowspan=3 | [http://www.lexique.org/listes/liste_lettres.php lexique.org] || Pourcentage de frappes (méthode 1) || 61,1 % || || || || 56,5 % || || 53,8 % || || 22,1 % || || 28,3 % ||
Ligne 73 : Ligne 73 :
| Pourcentage de frappes (méthode 3) || 63,8 % || || || || 59,1 % || || 56,3 % || || 23,1 % || || 29,5 % ||
| Pourcentage de frappes (méthode 3) || 63,8 % || || || || 59,1 % || || 56,3 % || || 23,1 % || || 29,5 % ||
|}
|}


=== Par lignes ===
=== Par lignes ===
Pourcentage de frappes par ligne (quelques pourcentages sont faussés par le manque de statistiques ne correspondant pas aux alliages de symboles). Mais je ne pense pas que ça influe de ± o,5%. Le corpus utilisé est celui de [[Fr%C3%A9quence_des_caract%C3%A8res#Corpus_de_Nicolas_C. | Nicolas Chartier]].
Pourcentage de frappes par ligne (quelques pourcentages sont faussés par le manque de statistiques ne correspondant pas aux alliages de symboles). Mais je ne pense pas que ça influe de ± 0,%. Le corpus utilisé est celui de [[Fréquence des caractères#Corpus_de_Nicolas_C.|Nicolas Chartier]].


{| class="wikitable" border="1"
{| class="wikitable" border="1"
Ligne 96 : Ligne 95 :


=== Comparateur de dispositions ===
=== Comparateur de dispositions ===
Un applet java adapté du comparateur de la disposition de clavier colemak est disponible à cette adresse : http://tomestla.info/bepo/ (il faudrait l'héberger sur le wiki non ?).  
Un applet java adapté du comparateur de la disposition de clavier colemak est disponible à cette adresse : http://tomestla.info/bepo/ (il faudrait l’héberger sur le wiki non ?).  
Il compare le bépo, l'azerty, le dvorak-fr et le dvorak-us (attention, la lettre morte du dvorak-fr n'est pas considérée).
Il compare le bépo, l’azerty, le dvorak-fr et le dvorak-us (attention, la lettre morte du dvorak-fr n’est pas considérée).
Les résultats donnent la distance parcourue, le pourcentage de frappe par ligne, le pourcentage de frappe d'une main et le pourcentage de frappe d'un doigt.
Les résultats donnent la distance parcourue, le pourcentage de frappe par ligne, le pourcentage de frappe d’une main et le pourcentage de frappe d’un doigt.


Au niveau de la fréquence d'utilisation des rangées utilisées et de la distance parcourue, la disposition bépo obtient quasiment les mêmes résultats que le dvorak us. En bépo, nos doigts parcourent environ 50 % de distance en moins qu'en azerty. Le bépo évite le plus les répétitions de touches avec le même doigt (''same finger''). Il utilise moins que les autres la rangée des chiffres et la rangée inférieure. Il choisit comme le dvorak-us d'utiliser la rangée de repos plus des deux tiers du temps (66-69%) là où la disposition dvorak-fr fait 56 % et l'azerty 25 %. Suivant la méthode Dvorak, le bépo choisit de prioriser la rangée supérieure en second (plus de 22 % sur la rangée supérieure). L'azerty se concentre lui sur la rangée supérieure (plus de 50%). Le dvorak-fr mise étrangement sur la rangée inférieure avant la rangée supérieure… Le bépo peut taper quelques caractères que les autres dispositions n'ont pas (''total keys'').
Au niveau de la fréquence d’utilisation des rangées utilisées et de la distance parcourue, la disposition bépo obtient quasiment les mêmes résultats que le dvorak us. En bépo, nos doigts parcourent environ 50 % de distance en moins qu’en azerty. Le bépo évite le plus les répétitions de touches avec le même doigt (''same finger''). Il utilise moins que les autres la rangée des chiffres et la rangée inférieure. Il choisit comme le dvorak-us d’utiliser la rangée de repos plus des deux tiers du temps (66-69 %) là où la disposition dvorak-fr fait 56 % et l’azerty 25 %. Suivant la méthode Dvorak, le bépo choisit de prioriser la rangée supérieure en second (plus de 22 % sur la rangée supérieure). L’azerty se concentre lui sur la rangée supérieure (plus de 50%). Le dvorak-fr mise étrangement sur la rangée inférieure avant la rangée supérieure… Le bépo peut taper quelques caractères que les autres dispositions n’ont pas (''total keys'').
[[Catégorie:Historique]]

Dernière version du 27 mars 2023 à 14:26

Obtention via Aspell

Préparatifs : Pour optimiser le processus, on fait un dump d’un des dictionnaires venant d’aspell :

$ aspell dump master fr > dump-fr.txt
$ wc -l dump-fr.txt
629569 dump-fr.txt

Donc, on part sur la base de 629 569 entrées (Il y a des mots, mais aussi des abréviations et possiblement quelques sigles).

Via awk ou egrep et quelques expressions rationnelles, on sélectionne les touches qui nous intéressent :

$ awk '/^[auiestrn]*$/' dump-fr.txt | wc -l
4255

Ce qui nous fait 4255 entrées pour la rangée de base du bépo.

Pour obtenir le nombre de mots en fonction du nombre de lettres :

$ awk '/^[auiestrn]*$/' dump-fr.txt |\
  perl -e '$word{-1+length $_}++ while (<STDIN>);\
  print "$_: $word{$_}\n" foreach sort {$a <=> $b} keys %word;'
1: 1
2: 26
3: 63
4: 150
5: 313
6: 497
7: 632
8: 686
9: 672
10: 523
11: 357
12: 204
13: 93
14: 31
15: 7

Statistiques

Globales

En résumé :

  • avec auiestrn, soit la rangée de base du bépo :
    • on a 4255 résultats, soit un peu moins de 7 % de la totalité du dictionnaire. On obtient 7 mots de 15 lettres.
    • La fréquence totale de ces 8 caractères représentent 62 % de la fréquence de tous les caractères (29 % pour qsdfjklm) Nemolivier
  • avec qsdfjklm, la rangée de base de l’azerty, on a 6 résultats, qui sont des unités (km, mm, ms, ml, dm et dl).
  • avec asdfjkl, soit en qwerty, 35 résultats. On a un résultat avec 7 lettres, ce qui est le maximum.
  • avec aoeuhtns, en dvorak-us, 813 résultats, soit un peu plus de 1 % du dictionnaire, et un résultat de 15 lettres.

Frappe dans la rangée de repos qsdfjklm - auietsrn :


Corpus Dispo bépo C. Marsan Dvorak-fr Dvorak-us azerty qwerty
touches auie tsrn +cm uiea trsn +ol oaue stnd +bfw aoeu htns +id qsdf jklm +gh asdf jkl +gh
Dico
Aspell-fr
Nombre de résultats 4255 10050 4255 13405 976 1846 813 3325 6 11 35 70
Longueur maximum (nombre) 15 (7) 17 (5) 15 (7) 23 (2) 13 (5) 14 (2) 15 (1) 16 (4) 2 (6) 2 (11) 7 (1) 8 (1)
Thomas Trempé Pourcentage de frappes 61,7 % 57 % 54,2 % 21,9 % 27,8 %
Nicolas C. Pourcentage de frappes 62 % 69 % 57 % 59 % 54,2 % 22 % 28 %
lexique.org Pourcentage de frappes (méthode 1) 61,1 % 56,5 % 53,8 % 22,1 % 28,3 %
Pourcentage de frappes (méthode 2)
Pourcentage de frappes (méthode 3) 63,8 % 59,1 % 56,3 % 23,1 % 29,5 %

Par lignes

Pourcentage de frappes par ligne (quelques pourcentages sont faussés par le manque de statistiques ne correspondant pas aux alliages de symboles). Mais je ne pense pas que ça influe de ± 0,5 %. Le corpus utilisé est celui de Nicolas Chartier.

Ligne bépoè dvorak-fr azerty
des chiffres 1,45 % 1,67 % 4,64 %
du haut 22,17 % 13,71 % 56,36 %
du milieu 69,03 % 58,93 % 23,33 %
du bas 7,35 % 25,69 % 15,67 %
main droite 49,55 % 58,6 %
main gauche 50,45 % 41,4 %

Comparateur de dispositions

Un applet java adapté du comparateur de la disposition de clavier colemak est disponible à cette adresse : http://tomestla.info/bepo/ (il faudrait l’héberger sur le wiki non ?). Il compare le bépo, l’azerty, le dvorak-fr et le dvorak-us (attention, la lettre morte du dvorak-fr n’est pas considérée). Les résultats donnent la distance parcourue, le pourcentage de frappe par ligne, le pourcentage de frappe d’une main et le pourcentage de frappe d’un doigt.

Au niveau de la fréquence d’utilisation des rangées utilisées et de la distance parcourue, la disposition bépo obtient quasiment les mêmes résultats que le dvorak us. En bépo, nos doigts parcourent environ 50 % de distance en moins qu’en azerty. Le bépo évite le plus les répétitions de touches avec le même doigt (same finger). Il utilise moins que les autres la rangée des chiffres et la rangée inférieure. Il choisit comme le dvorak-us d’utiliser la rangée de repos plus des deux tiers du temps (66-69 %) là où la disposition dvorak-fr fait 56 % et l’azerty 25 %. Suivant la méthode Dvorak, le bépo choisit de prioriser la rangée supérieure en second (plus de 22 % sur la rangée supérieure). L’azerty se concentre lui sur la rangée supérieure (plus de 50%). Le dvorak-fr mise étrangement sur la rangée inférieure avant la rangée supérieure… Le bépo peut taper quelques caractères que les autres dispositions n’ont pas (total keys).