American Standard Code for Information Interchange
ASCII (prononcé az-kee, ass-key si américain), est une table de caractères pour les ordinateurs. Il s'agit d'un code binaire utilisé par les équipements électroniques pour traiter du texte utilisant l'alphabet anglais, des chiffres et d'autres symboles courants. ASCII est l'abréviation de American Standard Code for Information Interchange (code standard américain pour l'échange d'informations). L'ASCII a été développé dans les années 1960 et était basé sur des codes antérieurs utilisés par les systèmes télégraphiques.
Le code comprend des définitions pour 128 caractères : la plupart sont les caractères imprimables de l'alphabet tels que abc, ABC, 123, et ?& ! Il existe également des caractères de contrôle qui ne peuvent pas être imprimés mais qui contrôlent la façon dont le texte est traité, pour commencer une nouvelle ligne par exemple. Ils figurent dans la colonne de gauche du tableau ci-dessous. La plupart des caractères de contrôle ne sont plus utilisés pour leur fonction initiale. Il n'y a pas de véritable contrôle de formatage (pour les caractères gras ou italiques, etc.)
Il arrive que quelqu'un parle d'un fichier ou d'un document en ASCII, c'est-à-dire en texte clair.
L'ASCII utilise 8 chiffres binaires (bits) pour représenter les caractères : 1000001 (ou 41 en hexadécimal ou 65 en base 10 standard) représente la lettre A en majuscule ; 1000010 représente B ; 1000011 représente C ; et ainsi de suite. Huit bits permettent d'inclure un bit de parité dans chaque octet envoyé sur un port série ou des modems, ce bit est utilisé pour éviter les erreurs. Cela était plus important il y a quelques années, lorsque les connexions étaient souvent bruyantes.
Les 95 caractères ASCII graphiques, numérotés de 32 à 126 (décimal)
ASCII étendu
L'ASCII n'a pas de diacritiques (marques qui sont ajoutées à une lettre, comme les points (umlauts) au-dessus des voyelles en allemand, ou le tilde (~) au-dessus du "n" pour le "ñ" utilisé en espagnol). Il n'a été conçu que pour l'anglais et ne fonctionne pas bien pour la plupart des autres langues. Certains mots anglais empruntés à d'autres langues utilisent également ces marques, comme les CV (voir Annexe : mots anglais avec diacritiques).
Cela a conduit certains systèmes à utiliser 8 bits (un octet complet) au lieu de 7 bits. Le nom propre des systèmes qui utilisent 8 bits est appelé ASCII étendu. Huit bits permettent d'utiliser 256 caractères. Les 128 premiers caractères doivent être les mêmes que pour l'ASCII et les autres sont généralement utilisés pour les lettres alphabétiques avec des accents, par exemple comme É, È, Î et Ü. Cela résout le problème pour les langues qui sont basées sur l'alphabet latin, bien que tous les systèmes ASCII étendus ne soient pas les mêmes. D'autres alphabets, comme l'alphabet grec et l'alphabet cyrillique, nécessitent un jeu de caractères différent. Et certains systèmes comme ceux qui utilisent les caractères chinois ne fonctionnent toujours pas, car ils utilisent des milliers de caractères. L'unicode a donc été créé pour avoir un système commun à toutes les langues.
L'ASCII standard est encore couramment utilisé, notamment dans les logiciels informatiques et les fichiers HTML. Jusqu'en 2010, c'était la norme pour les URL. Souvent, un site web qui comporte des champs pour la saisie de texte ne prend que du texte ASCII. Toute balise spéciale pour du texte en gras ou centré, etc. ne s'affichera pas correctement.
Questions et réponses
Q : Qu'est-ce que l'ASCII ?
R : L'ASCII est une table de caractères pour ordinateurs, qui utilise le code binaire pour traiter les textes utilisant l'alphabet anglais, les chiffres et d'autres symboles courants.
Q : Que signifie l'acronyme ASCII ?
R : ASCII signifie American Standard Code for Information Interchange.
Q : Quand l'ASCII a-t-il été développé ?
R : L'ASCII a été développé dans les années 1960.
Q : Combien de caractères sont inclus dans le code ?
R : Le code comprend des définitions pour 128 caractères, auxquels sont attribués des numéros de 0 à 127.
Q : Combien de bits faut-il pour représenter un caractère ASCII ?
R : Il faut 7 chiffres binaires (bits) pour représenter un caractère ASCII.
Q : Un fichier informatique ASCII utilise-t-il un octet par caractère ?
R : Oui, un fichier informatique ASCII utilise un octet par caractère, avec 8 bits par octet.
Q : L'ASCII standard est-il encore couramment utilisé aujourd'hui ? R : Oui, l'ASCII standard est encore couramment utilisé de nos jours, notamment dans les logiciels informatiques et les fichiers HTML.