Les normes

L'histoire des jeux de caractères pour les besoins de l'informatique débute avec le codage EBCDIC (sur 8 bits) utilisé par IBM et le codage ASCII (sur 7 bits) utilisé par le reste du monde. Le code EBCDIC n'est pas une norme, mais le code ASCII est une norme de l'ANSI.

En 1963, l'ISO crée une norme internationale à partir de la norme ASCII et, internationalisation oblige, elle réserve 10 caractères pour des variantes nationales. La France (dans une norme NF) en utilisera 5 pour y caser des lettres accentuées (à ç é è ù) laissant de côté l'accent circonflexe si cher aux académiciens français, le tréma et les ligatures. Cette norme est donc inutilisable pour écrire réellement en français, mais il faut dire à la décharge de l'ISO, qu'en utilisant un code à 7 bits, cela était impossible.

En 1988, l'ISO édite une nouvelle norme de jeu de caractères à 8 bits cette fois pour prendre en compte les particularités des langues européennes. Mais la diversité est telle qu'il n'est pas possible de mettre tous les signes typographiques dans un seul jeu de 256 caractères. Les langues ont donc été regroupées en familles, et la norme ISO-8859 comprend plusieurs jeux de caractères. Celui qui nous intéresse est celui qui est prévu pour les langues d'europe occidentale et qui est référencé ISO-8859-1 ou ISO-LATIN-1. Malheureusement, les français ne sont pas de très bons lobbyistes dans les instances internationales, et aussi incroyable que cela puisse paraître, la ligature \oe du français a été oubliée !



Sous-sections
Matthieu Moy 2017-02-08