« Glossaire » : différence entre les versions
(→Ordre et classement alphabétique : La page « Classement alphabétique informatisé » a, hélas !, été supprimée de Wikipédia.) |
(→U : Unicode, UTF, UTF-8, UTF16) |
||
Ligne 172 : | Ligne 172 : | ||
== U == | == U == | ||
=== Unicode === | |||
Unicode est un standard dont l’objectif est d’associer un identifiant (un numéro) à tout caractère utilisé dans quelque langue que ce soit. Ce numéro est généralement représenté sous forme hexadécimale et préfixé d’un « U+ », par exemple U+0061 (pour « a ») ou U+0950 (pour « ॐ »). Cette association identifiant / caractère n’impose aucune représentation graphique (glyphe) particulière. | |||
Il existe différentes manières de représenter les caractères Unicode dans une mémoire d’ordinateur : on les appelle encodages. | |||
Pour permettre une représentation de tout caractère Unicode quel que soit l’encodage utilisé, aucun caractère Unicode ne se verra attribuer un numéro plus grand que 0x10FFFF. | |||
Les numéros de caractères de l’ASCII et de l’ISO 8859-1 sont repris tels quels par Unicode. | |||
* [http://fr.wikipedia.org/wiki/Unicode Unicode] sur Wikipédia | |||
=== UTF === | |||
UTF signifie Unicode Transformation Format. Techniquement parlant, le rôle d’UTF est de transformer une suite de caractères Unicode en une suite d’octets (eux-mêmes une suite de bits, l’unité informatique fondamentale), et réciproquement. | |||
=== UTF-8 === | === UTF-8 === | ||
L’UTF-8 est un encodage des caractères Unicode qui utilise de 1 à 4 octets par caractère. | |||
Un texte qui ne contient que des caractères de l’ASCII sera inchangé une fois converti en UTF-8 : l’UTF-8 est transparent pour l’ASCII. | |||
{|class="wikitable" style="text-align: center;" | |||
!Caractères!!Nombre de bits<br />significatifs dans le<br />numéro du caractère!!Nombre d'octets<br />dans le codage<br />UTF-8!!Représentation binaire de l’UTF-8 (*) | |||
|- | |||
|U+0000 — U+007F||≤ 7||1||align="right"|0******* | |||
|- | |||
|U+0080 — U+07FF||8 à 11||2||align="right"|110***** 10****** | |||
|- | |||
|U+0800 — U+FFFF||12 à 16||3||align="right"|1110**** 10****** 10****** | |||
|- | |||
|U+10000 — U+10FFFF||17 à 21||4||align="right"|11110*** 10****** 10****** 10****** | |||
|} | |||
(*) Dans cette colonne, les astérisques représentent les bits qui contiendront le numéro du caractère. Par exemple, pour le caractère « é » (U+00E9), 0x00E9 s’écrit 0000 0000 1110 1001 en binaire. Il y a 8 bits significatifs (1110 1001), le caractère sera donc codé sur 2 octets. La structure de ces deux octets sera 110***** 10******. Il y a de la place pour 11 bits. On complète à gauche par des 0 et l’on dispose ces 11 bits aux emplacements marqués par les « * » : 11000011 10101001. (En hexadécimal, ça donne C3 A9.) | |||
* [http://fr.wikipedia.org/wiki/UTF-8 UTF-8] sur Wikipédia | * [http://fr.wikipedia.org/wiki/UTF-8 UTF-8] sur Wikipédia | ||
=== UTF-16 === | |||
L’UTF-16 est un encodage des caractères Unicode qui utilise 2 ou 4 octets par caractère. | |||
Pour les caractères U+0000 à U+FFFF, on utilise deux octets par caractère. Si le premier octet est l’octet de poids fort, on parle d’UTF-16 LE (Little-Endian ou petit-boutien), dans le cas contraire, on parle d’UTF-16 BE (Big-Endian ou gros-boutien). Pour les caractères dont le numéro excède 0xFFFF, on lui soustrait 0x10000 et l’on exprime cette différence sur deux « chiffres » en base 1024. On ajoute 0xD800 au premier de ces deux « chiffres » et 0xDC00 au second. On obtient ainsi un seizet d’indirection supérieur et un seizet d’indirection inférieur qui, ensemble, représentent le caractère Unicode de départ en UTF-16. | |||
* [http://fr.wikipedia.org/wiki/UTF-16 UTF-16] sur Wikipédia | |||
== V == | == V == |
Version du 27 juin 2010 à 17:29
Le glossaire à besoin de vous ! Complétez-le sans hésiter !!
Sommaire : | # - A B C D E F G H I J K L M N O P Q R S T U V W X Y Z |
---|
#
**ert*
Désignation générique des dispositions de clavier les plus courantes (azerty, qwerty et qwertz).
A
Accès direct
Un caractère est en accès direct lorsque, pour le composer, il suffit d'appuyer une et une seule fois sur une touche du clavier, quelle que soit cette touche. Cela signifie qu'il ne faut utiliser ni modificateur, ni touche morte, qu'il n'est pas nécessaire d'appuyer deux fois sur la touche, etc. C'est le mode de composition le plus simple et le plus ergonomique. Toutefois, un caractère en accès direct mais placé sur une touche difficilement accessible (touches sur les cotés du clavier ou au centre en haut, petite touche, etc.) peut n'être que moyennement facile à composer — l'accès direct n'est donc pas la panacée. Dans le cadre de la création d'une nouvelle disposition clavier raisonnée, on réserve évidemment les accès directs aux caractères les plus fréquents, puis on s'intéresse à la répartition de ces caractères sur le clavier, ce qui constitue le cœur du problème. Par la suite se posera le problème des accès indirects, dits « séquentiels. »
Alt
Alt est une touche modificatrice.
- Alt sur Wikipédia
AltGr
AltGr (Alternate Graphic) est une touche modificatrice permettant l'accès à un certain nombre de caractères annexes. Dans la disposition bépo, cette touche est largement utilisée et fonctionne rigoureusement comme Maj : voir la carte AltGr du bépo.
- À propos d’un AltGr symétrique
- AltGr sur Wikipédia
B
Bépoète ou bépoïste
Un utilisateur de la disposition de clavier bépo.
C
CapsLock
La touche CapsLock (de caps lock en anglais, littéralement « verrouiller les majuscules »), dénommé Verr. Maj ou VerrMaj (voire « Verrouiller Maj » en toutes lettres) en français, permet d'activer un mode majuscule continu, à la manière d'un interrupteur. C'est donc une touche assimilée à une touche morte quant à son fonctionnement, mais en réalité, elle possède un comportement variable selon le système d'exploitation. La disposition bépo limite son usage à la composition des majuscules et chiffres pour viser la portabilité maximale.
- Verr. Maj sur Wikipédia
Carte simplifiée
La carte simplifiée est une vue schématique partielle de la disposition bépo, présentant seulement les caractères les plus importants.
Compose
Compose est un mécanisme de modification ponctuelle de saisie. Une touche dite « touche morte » permet d'activer une séquence de composition étendue. L'appui successif sur une ou plusieurs touches permettra de composer un très grand nombre de caractères. Contrairement aux touches de modification, la touche affectée à la fonction Compose ne doit pas être maintenue appuyée en vue de réaliser une combinaison : elle agit comme une bascule entre le mode de frappe normal et le mode Compose. Après l'appui sur la touche compose, les touches suivantes sont interprétées séquentiellement dans ce mode. Si la séquence tapée n'existe pas, le clavier repasse en mode normal. C'est donc une solution assez ergonomique, puisqu'elle ne brise pas la séquence continue de frappe et ne nécessite pas l'usage des deux mains comme c'est souvent le cas pour un raccourci avec une touche modificatrice. Un problème important reste celui de la portabilité d'un tel mécanisme.
Clavier décalé
Abusivement appelé "clavier droit", il représente sans doute 99% des claviers utilisés dans le monde. Sa particularité, héritage des machines à écrire mécaniques et de leurs contraintes, est d'avoir les rangées de touches décalées les unes par rapport aux autres. Ce décalage, s'il est plutôt favorable pour la main droite, est totalement anti-ergonomique pour la main gauche puisque lorsqu'on tape selon les méthodes dactylographiques et les positions de doigts associées, le poignet gauche est contraint d'être en inclinaison ulnaire (vers la gauche). Cette position du poignet est inconfortable, cause de douleurs et de frottement des tendons au passage du canal carpien. Les compensations nécessaires peuvent être facteur de modifications de la statique du dos.
Clavier en colonnes
Il cherche à corriger le principal défaut des claviers décalés en réalignant les touches les unes par rapport aux autres. Tous les vrais claviers ergonomiques présentent cette particularité.
D
Digramme
On désigne par digramme un duo de caractères qui a statut d'unité fondamentale d'écriture d'une langue. Grosso modo, toutes les séquences très utilisées de deux caractères consécutifs sont des digrammes. Par exemple, « ll », « ai », « es », « ou », « en », « mm » sont des digrammes de la langue française, car ils reviennent très souvent dans les mots (cherchez les digrammes de ce paragraphe !). Un digramme peut être une entité phonétique (ie. on peut la prononcer naturellement, par exemple « ou ») ou ne constituer qu'une brique d'écriture (par exemple, il n'est pas possible de prononcer naturellement le digramme « mn »). Les digrammes peuvent aussi être constitué d’un ou deux symboles, tel que « l’ » ou « ? » (espace insécable + ?). Ces différents digrammes étant la seconde brique constitutive du langage typographique après les caractères seuls, un clavier raisonné tel que le bépo se doit de faciliter leur saisie et leur apprentissage, en plaçant au mieux les lettres sur le clavier : les digrammes les plus fréquents, au moins, doivent être faciles à taper en séquence (touches accessibles, en accès direct, en alternant l’usage des mains ou facile pour un digramme à une main).
- Fréquence des digrammes
- Digramme sur Wikipédia
Disposition Dvorak
Une disposition Dvorak est une disposition des touches de clavier dont la logique répond aux grandes lignes de la méthodologie Dvorak. À l'origine, August Dvorak et William Dealey ont mis au point, dans les années 1930, une carte de la disposition des touches du clavier anglais pour laquelle les lettres les plus fréquentes étaient au centre du clavier, par opposition à la répartition semi-aléatoire de la disposition dominante d'alors et d'aujourd'hui, le qwerty. Cette approche a été reprise pour créer de nouvelles dispositions de clavier adaptées à de nombreuses langues. Le bépo est une disposition Dvorak pour la langue française, issue d'une méthodologie Dvorak affinée.
D'un point de vue ergonomique et sur le plan dactylographique, les disposition Dvorak représentent une amélioration importante par rapport aux dispositions dominantes mais vieillissantes, telles que le qwerty et l'azerty : gains en confort, en fluidité, en logique, en rapidité, diminution de la fatigue, de la charge mentale, et apport de la frappe à dix doigts en aveugle. D'un autre coté, la méthodologie Dvorak est à décliner par groupes linguistiques et ne peut pas donner naissance à un clavier universel ou parfait ; par ailleurs, l'apprentissage d'un « nouveau clavier » est souvent considéré comme une tâche inutile et/ou insurmontable, souvent par ceux-là même qui auraient le plus à en profiter dans un contexte où l'informatique est devenue omniprésente et où le clavier représente un vecteur d'expression quotidien.
- Disposition Dvorak sur Wikipédia
E
Espace insécable
L’espace insécable est une espace typographique qui lie deux symboles ayant un lien sémantique fort. Sa présence entre les deux symboles qui l’encadrent interdit qu’ils puissent être séparés (à l’occasion d’une justification ou un saut de ligne par exemple). En français elle est obligatoire devant les caractères suivant : « : », « ; », « ! », « ? », “»” et après “«”. Bien que ce ne soit pas la règle typographique exacte (elle est alors insécable et justifiante à la fois), elle peut aussi être utilisée pour suivre ou précéder — selon qu’il est ouvrant ou fermant — le tiret d’incise « — », ou tiret sur cadratin.
L'espace insécable est présente sur le bépo en clavier bépoMaj+clavier bépoEspace. L’espace fine est présente en clavier bépoAltGr+clavier bépoMaj+clavier bépoEspace, mais attention à son usage : seule les polices de haute volée la gèrent correctement.
PS : lorqu’il est employé dans un contexte typographique, le mot « espace » est féminin !
F
G
H
I
J
K
L
M
Maj
La touche Maj (pour « majuscule »), souvent dénommé Shift, est un modificateur qui permet notamment de composer les capitales des lettres de l'alphabet. Elle intervient aussi dans beaucoup de raccourcis. Il s'agit d'une touche symétrique, associée à la touche Verr. Maj.
- Touche Maj sur Wikipédia
Modificateur
Un modificateur ou touche modificatrice/de modification est une touche qui permet de modifier le comportement d'une autre touche lorsque les deux sont appuyées en même temps. L'utilisateur doit ainsi, séquentiellement :
- appuyer sur le modificateur — qui n'a pas d'effet par lui-même et ne compose donc pas de caractère ;
- le garder enfoncé ;
- appuyer sur une autre touche, afin de déclencher une action quelconque.
Les modificateurs permettent, soit de composer d'autres caractères que ceux obtenus en accès direct, soit de déclencher des raccourcis clavier. Un exemple bien connu est le raccourci clavier bépoAlt+clavier bépoF4 qui, en général, ferme la fenêtre active et/ou quitte le programme courant : « Alt » est le modificateur de cette combinaison de touches, « F4 » ayant ici un comportement (fermer la fenêtre active) différent de celui obtenu sans modificateur (par exemple, clavier bépoF4 en accès direct affiche les favoris dans le navigateur Firefox, et réaliserait sans doute une action différente dans un autre programme !).
- Modificateurs courants et standards : Alt, Ctrl, Maj
- À ne pas confondre avec les touches mortes !
- Touche de combinaison sur Wikipédia
N
O
Ordre et classement alphabétique
Chaque langue dispose d'un ordre alphabétique pour classer les caractères de son alphabet, ce trie sert ensuite au classement alphabétique des mots.
P
Portabilité
La notion de portabilité fait référence au caractère universel d'un mécanisme informatique. Lorsqu'on implémente une fonctionnalité quelconque dans un logiciel destiné à fonctionner dans plusieurs environnements différents, la question suivante se pose fréquemment : « s'il a été possible d'apporter une solution technique A à un problème P dans l'environnement informatique E1 (GNU/Linux par exemple), cette solution est-elle directement transposable dans l'environnement E2 (Windows, par exemple) ? » Si oui, alors A est portable et un seul effort de programmation a permis de résoudre P dans des contextes d'exécution différents. En général, cela tient à l'existence d'une certaine couche d'abstraction commune au-dessus des mécanismes particuliers, la solution technique ne s'occupant que de dialoguer avec cette couche d'abstraction, sans entrer dans les détails « bas niveau. »
En pratique, les contextes d'utilisations potentiels (et en particulier, les différents systèmes d'exploitation — OS) sont (très) nombreux et reposent sur des briques partiellement ou totalement incompatibles, à plus forte raison quand des briques propriétaires sont impliquées. La recherche de solutions le plus portable possible est donc cruciale. Pour contourner ces particularismes, les pilotes informatiques que l'utilisateur installe intègrent souvent la couche d'abstraction mentionnée ci-avant, chargée de faire l'interface entre les spécificités d'un système donné et des commandes génériques dits de « haut niveau. » Cette approche n'est pas nécessairement applicable pour les logiciels qui s'occupent de fonctionnalités fondamentales (gestion de la mémoire, des périphériques matériels… par exemple), et pour le cas particulier des dispositions claviers, la portabilité totale n'existe pas encore.
À ce titre, compte-tenu des mécanismes très différents de gestion des dispositions claviers dans les principaux systèmes d'exploitation, le projet bépo met en œuvre une approche « atomique », c'est-à-dire sans couche d'abstraction logicielle : il existe autant de pilotes bépo que d'OS supportés. La couche d'abstraction est donc purement conceptuelle (au sens où il n'existe qu'une seule disposition bépo « sur le papier », telle qu'elle est décrite sur ce site). Par le jeu des équivalences logicielles, mises en œuvres dans les différents pilotes spécifiques, les mêmes comportements sont reproduits dans les différents OS (à savoir, le placement des touches, la gestion des touches de modification, des touches mortes, etc.). D'un point de vue utilisateur, l'ensemble peut-être considéré comme « portable » à l'heure de la version 1.0, qui fonctionne parfaitement et entièrement sur tous les OS officiellement supportés.
- Portabilité sur Wikipédia
Q
R
Raccourci clavier
Un raccourci clavier est une combinaison de touches qui, une fois enfoncée, permet d'exécuter un programme ou une fonction/commande particulière dans un programme. Un célèbre raccourci clavier est clavier bépoAlt+clavier bépoF4, faisant intervenir le modificateur « Alt. »
- Raccourci clavier sur Wikipédia
S
Shift
Voir Maj.
T
Touche morte
Une touche morte est une touche qui ne provoque pas l’affichage immédiat d'un caractère, mais modifie l’effet de la prochaine frappe.
Exemple : la touche clavier bépo¨, appuyée et relâchée, ne provoque pas d'affichage, mais si elle est suivie de la touche clavier bépoe, le caractère « ë » est composé, ce qui permet notamment d'écrire correctement le mot « noël. »
Il faut bien distinguer les touches mortes des touches modificatrices tel que « AltGr. » Les modificateurs n'agissent sur la frappe suivante que si elles restent enfoncées (notion usuelle de raccourci clavier).
Troubles musculosquelettiques
Il s'agit d'un ensemble disparates de pathologies liées notamment à l'usage intensif des outils informatiques. Ils peuvent tout aussi bien concerner les articulations des doigts que la vision, ou encore les muscles du dos. On parle souvent de TMS pour simplifier. Parmi les plus connus, citons la tendinite et le syndrome du canal carpien. Dans le contexte de la frappe au clavier et de l'usage d'un ordinateur en général, les TMS sont une pathologie très courante, allant de syndromes bénins à des lésions appelant intervention chirurgicale et rééducation. Une bonne ergonomie du poste de travail (ou de loisir…) est un moyen efficace pour réduire les risques de TMS, et la disposition bépo souhaite participer à cet effort de rationalisation en réduisant les contraintes musculaires et mentales liées à la frappe au clavier.
- Troubles musculosquelettiques sur Wikipédia
U
Unicode
Unicode est un standard dont l’objectif est d’associer un identifiant (un numéro) à tout caractère utilisé dans quelque langue que ce soit. Ce numéro est généralement représenté sous forme hexadécimale et préfixé d’un « U+ », par exemple U+0061 (pour « a ») ou U+0950 (pour « ॐ »). Cette association identifiant / caractère n’impose aucune représentation graphique (glyphe) particulière.
Il existe différentes manières de représenter les caractères Unicode dans une mémoire d’ordinateur : on les appelle encodages.
Pour permettre une représentation de tout caractère Unicode quel que soit l’encodage utilisé, aucun caractère Unicode ne se verra attribuer un numéro plus grand que 0x10FFFF.
Les numéros de caractères de l’ASCII et de l’ISO 8859-1 sont repris tels quels par Unicode.
- Unicode sur Wikipédia
UTF
UTF signifie Unicode Transformation Format. Techniquement parlant, le rôle d’UTF est de transformer une suite de caractères Unicode en une suite d’octets (eux-mêmes une suite de bits, l’unité informatique fondamentale), et réciproquement.
UTF-8
L’UTF-8 est un encodage des caractères Unicode qui utilise de 1 à 4 octets par caractère.
Un texte qui ne contient que des caractères de l’ASCII sera inchangé une fois converti en UTF-8 : l’UTF-8 est transparent pour l’ASCII.
Caractères | Nombre de bits significatifs dans le numéro du caractère |
Nombre d'octets dans le codage UTF-8 |
Représentation binaire de l’UTF-8 (*) |
---|---|---|---|
U+0000 — U+007F | ≤ 7 | 1 | 0******* |
U+0080 — U+07FF | 8 à 11 | 2 | 110***** 10****** |
U+0800 — U+FFFF | 12 à 16 | 3 | 1110**** 10****** 10****** |
U+10000 — U+10FFFF | 17 à 21 | 4 | 11110*** 10****** 10****** 10****** |
(*) Dans cette colonne, les astérisques représentent les bits qui contiendront le numéro du caractère. Par exemple, pour le caractère « é » (U+00E9), 0x00E9 s’écrit 0000 0000 1110 1001 en binaire. Il y a 8 bits significatifs (1110 1001), le caractère sera donc codé sur 2 octets. La structure de ces deux octets sera 110***** 10******. Il y a de la place pour 11 bits. On complète à gauche par des 0 et l’on dispose ces 11 bits aux emplacements marqués par les « * » : 11000011 10101001. (En hexadécimal, ça donne C3 A9.)
- UTF-8 sur Wikipédia
UTF-16
L’UTF-16 est un encodage des caractères Unicode qui utilise 2 ou 4 octets par caractère.
Pour les caractères U+0000 à U+FFFF, on utilise deux octets par caractère. Si le premier octet est l’octet de poids fort, on parle d’UTF-16 LE (Little-Endian ou petit-boutien), dans le cas contraire, on parle d’UTF-16 BE (Big-Endian ou gros-boutien). Pour les caractères dont le numéro excède 0xFFFF, on lui soustrait 0x10000 et l’on exprime cette différence sur deux « chiffres » en base 1024. On ajoute 0xD800 au premier de ces deux « chiffres » et 0xDC00 au second. On obtient ainsi un seizet d’indirection supérieur et un seizet d’indirection inférieur qui, ensemble, représentent le caractère Unicode de départ en UTF-16.
- UTF-16 sur Wikipédia
V
W
X
xkb
xkb, pour X keyboard extension, est un programme qui étend les possibilités de contrôle du clavier par rapport à ce qui est offert par le protocole du noyau du système X Window. Les caractéristiques principales de xkb sont :
- support amélioré des modificateurs ;
- meilleur traitement des groupes de touches ;
- contrôle étendu des indicateurs sonores et visuels du clavier (dels et bips) ;
- introduction de nouveaux paramètres de contrôle du clavier ;
- association d’actions aux touches (d'un type particulier).
xkb est désormais très largement répandu.
- X keyboard extension sur Wikipédia
xmodmap
Le fichier .Xmodmap
, placé dans le dossier $HOME
(ou sur une clef USB), permet de modifier le comportement de toutes les touches (y compris les touches modificatrices). C’est un moyen facile d’inverser deux touches sur un clavier exotique ou d'ajouter un modificateur plus intéressant sur CapsLock.
La syntaxe prend la forme suivante :
keycode XX = yyyyy zzzzzz kkkkkk
où XX est le keycode de la touche à modifier (utiliser xev pour le connaître), et yyyyy zzzzzz kkkkkk sont les symboles à afficher (identique au xkb).