Discussion:AnalyseSaisie

De Disposition de clavier bépo

J'aime beaucoup l'idée d'analyse de saisie. Je pense que ça permet de compléter le corpus. En effet, je pense que l'analyse de la saisie seule est insuffisante car par exemple sur l'azerty on aurait exclu tous les caractères n'existant comme par exemple: «»… etc… Je me dis qu'il serait bien d'inclure une étape de filtrage de la saisie comme par exemple rappeler à la personne de supprimer ses mots de passe à l'aide d'outils tels que sed ou grep. Thargos 27 décembre 2012 à 15:55 (UTC)


«Mouais… Ça ne m’a pas forcément l’air très pertinent. Autant sur une utilisation très particulière (vim, xterm…), pourquoi pas, autant pour une utilisation générale, on aura des chiffres qui ne voudront pas dire grand chose. Partager des stats de key-logger pourrait poser des problèmes de sécurité. Il faudrait le désactiver manuellement à chaque mot de passe tapé. Et puis il faudrait un key-logger par OS, et enfin pour les *nixiens, je ne sais pas si c’est facile pour faire un keylogger qui marche sur les tty. Plutôt des analyses de corpus de textes, ce qui est plus intéressant, car ne reflétant pas une utilisation particulière. » Cédric Thu, 27 Dec 2012 13:25:02 +0100

Une comparaison de nos stats en parallèle de nos profils pourrait peut-être faire ressortir des besoins communs à certains groupes, plutôt que de faire du spécifique par personne. Cf dans un tout autre domaine la politique de Levis avec ses dernières coupes de jeans pour femme. (JulieCaroline)
« J’en doute. Des données brutes sont trop dangereuses à communiquer (mots de passe), et des données traitées statistiquement perdent beaucoup de leur sens, en plus d’exposer les caractères contenus dans les mots de passe. À la limite, ce qui pourrait être intéressant, c’est que chaque logiciel ait son propre log des caractères tapés durant la session. Seulement, c’est à chaque logiciel de gérer ça, et en pratique c’est quasi impossible à mettre en place (le plus simple serait de hacker gtk pour qu’il fasse ses propres logs qu’on pourrait alors parser pour exclure les mots de passe par exemple ; mais ça ne marcherait que pour les applications gtk ; il faudrait faire pareil pour QT, et pour Windows, ça m’a pas l’air possible…). Bref, je maintiens que l’analyse de corpus est plus intéressante. D’autant plus que Ctrl+C,X,V sont beaucoup moins fréquents qu’à peu près n’importe quelle lettre tapée au clavier. (Cédric Thu, 27 Dec 2012 14:35:41 +0100)
« Rien n'empêche de traiter les données avec de les poster, j'ai essayé de me faire un petit script tout à l'heure qui parse les logs de l'utilitaire logkeys sous linux. Ça me retourne chaque lettre de l'alphabet avec son nombre d'occurence dans les logs. Du coup, mots de passe protégés, et ça reflète vraiment l'utilisation que je fais de mon clavier. Après rien n'empêche de grouper les résultat sous différents profils (genre développeur, rédacteur, baladeur, etc...) Chaqun upload ses résultats sous la section qui, selon lui, lui correspond le mieux.

Par la suite, les données sont mises en commun afin d'établir des profils « généraux ». Puis, à partir de là, ça sera tout de même plus clair, même si avec cette méthode, les di/tri-gramme sont pas détectés par exemple. » (Z3bra)

« Avec un keylogger hardware tout passe, et il faut un script open source qui compile — à partir du log brut du keylogger — les résultats sur le poste local, l'export resultant étant purement statistique personne ne saura ce qui a été tapé en particulier. L'idée générale c'est d'analyser une « session de travail » d'un profil d'utilisateur. Par exemple un developer ne fera pas forcement que du code mais aussi potentiellement des mails en français ou anglais, des spécifications… ensuite en comparant les sessions de tout le monde peut-être qu'il en ressortira des points marquants communs. » EyEBURNeR Thu, 27 Dec 2012 13:29:31 +0100

« Tout en sachant que notre utilisation n’est pas nécessairement représentative de celle de la population visée par le plan de domination du monde. N’empêche, comparer des stats d’utilisation et celles issues d’un corpus de texte devrait être intéressant. » Loïc Thu, 27 Dec 2012 14:02:38 +0100