Discussion:Fréquence des caractères
Liens vers les corpus
Le lien vers le corpus de Thomas Tempé est mort et il n'y a pas de lien vers celui de Nicolas Charlier… Quelqu'un pourrait-il les raffraichir? Lawrent 24 juillet 2013 à 10:55 (UTC)
- Le corpus de Thomas Tempé ne semble plus en ligne nulle part : j'ai envoyé un courriel à l'auteur pour voir s'il le remettrait en ligne (ou nous l'enverrait pour hébergement). L'archive de la description du corpus montre qu'on ne pourra pas le refaire à l'identique (quels courriels des liste de diffusion avait-il choisis ?) mais je peux en refaire un s'en approchant sinon. Pomme (discussion) 17 juin 2015 à 17:16 (CEST) .
Statistiques chiffres
(de l'ancien pmwiki Données)
Sur les stats que j'ai fait de mon coté j'ai ca pour les chiffres : (symbole / position dans le classement / nb d'occurence)
1 41 15618 2 45 14538 0 48 14154 3 52 8744 5 55 5182 4 57 4835 6 58 3566 8 59 3345
Dump de wikipedia
« (Crako prépare une analyse fréquentielle basée sur l'encyclopédie wikipédia francophone qui devrait permette de trancher.) » Wikipedia ne comportant que des articles encyclopédique, il doit logiquement y avoir moins de « je » et de future qu'une discussion IRC, on pourrait citer d'autres exemples. Bref ça sera mieux, mais toujours pas parfait. Olympi 18 janvier 2009 à 17:06 (CET)