Utilisatrice:Ariasuni/V2/Données
Données qui seront utiles à l'algorithme.
Données brutes
Corpus
Français et anglais, ce dernier comptant à 20% ou quelque chose comme ça.
On en tirera des statistiques:
- Liste des caractères avec leur fréquence
- Liste des digrammes et leur fréquence
Certains textes seront donnés par les utilisateurs, afin d'être plus représentatif de l'usage quotidien du clavier.
Données générées
Les données générées doivent pouvoir être produite facilement et rapidement afin de récolter un maximum de retours utilisateurs.
Carte d'accessibilité des touches
Les CAT permettent de représenter l'accessibilité d'une touche globalement, néanmoins ça ne représente pas bien la réalité parce que ces caractères sont frappés une suite de lettre, et que la lettre frappé juste avant peut fortement influencer l'accessibilité de la touche à ce moment-là.
Elle peut être obtenue facilement grâce à un duel d'accessibilité.
Ajustements
Voici une sélection d'ajustements pouvant être fait pour réduire le nombre de duels possibles, afin de pouvoir produire une CAT plus rapidement.
Rangées des chiffres et 105e touche
Les duels d'accessibilité sont assez longs à faire. Vu que la rangée des chiffres et la 105e touche (absente de certains claviers ou très mal placé (TypeMatrix)) ne compte pas dans l'algorithme, on n'a pas besoin d'avoir beaucoup de données à ce sujet.
Clavier orthogonal
Si on prend en compte un clavier orthogonal, beaucoup de duels sont inutiles. Il suffit de ne prendre en compte que la partie droite du clavier (ce qui fait que l'on passe de 34 à 19 touches, en ne comptant pas la rangée des chiffres).
Conclusion
Au départ, il y a 1128 duels possibles ((48×47)÷2, un caractère + un autre caractère parmi ceux qui ceux qui restent, on divise par deux car on ne fait pas E vs T et T vs E).
Si on prend en compte uniquement le premier ajustement, on a 561 possibilités ((34*33)/2).
Si on prend en compte les deux ajustements listés au dessus, on a 171 possibilités ((19*18)/2).
Carte d'accessibilité des digrammes
Une CAD permet de modéliser la difficulté ou la facilité à produire un digramme. Cela représente bien la réalité, mais c'est plus long à faire et un peu plus complexe.
Les ajustements proposés pour valables aussi pour la carte d'accessibilité des digrammes. Néanmoins même avec ces simplification, le nombre de duels à faire est trop élevé (presque 30 000). Du coup pour simplifier on fait les duels:
- De la rangée de repos vers la rangée de repos
- De la rangée de repos vers une autre rangée
- D'une autre rangée vers la rangée de repos
On utilisera ces données directement pour les autres rangées, sauf pour la première catégorie moyennant un malus de changement de ligne.
Il restera à faire les «sauts de ligne» (passer de la ligne au-dessus de la rangée de repos à celle en-dessous): certains sont assez faciles à faire, d'autres pas du tout.
Enfin, il reste comme exception: ZW, MW et ÇW.
Au final, cela fait 6*17 possibilités pour la rangée de repos, 6*6 pour les «sauts de ligne», ainsi que 3 exceptions; on multiplie par deux car TS ≠ ST, ce qui fait 282 possibilités!