Code Baudot

From Wikipedia, the free encyclopedia

Bande de papier avec des trous représentant des caractères du « code Baudot ».
Le clavier et ses cinq touches, 1884.

Le code Baudot est dans l'histoire un des premiers codages des caractères binaires. Il est plus ancien que le code ASCII par exemple. Il est aussi appelé code télégraphique Alphabet International (AI) no 1 ou Alphabet International (AI) no 2 ou code CCITT no 2.

C'est un code binaire : chaque caractère est codé par une série de bits (0 ou 1), ce qui permet 25 = 32 combinaisons. Ces 32 caractères ne suffisent pas pour coder les lettres (26), les chiffres (10), les signes opératoires (+-/x=), la ponctuation (, ;.:!?), et les autres symboles (&, #..) ; le code Baudot utilise donc deux jeux de caractères appelés Lettres (Lower Case) et Chiffres (Upper Case). Le jeu de caractères Chiffre comprend les signes opératoires et de ponctuation et les autres symboles. Deux caractères, Inversion Lettres et Inversion Chiffres (code 31 et 27), permettent le passage d'un jeu de caractères à l'autre.

Il s'agit donc du premier codage des caractères mécanisé.

Un inconvénient évident de ce code réside dans les commutations fréquentes entre jeux de caractères. D’autre part, bien que ce code soit plus riche que le code Morse international, il ne traite pas les minuscules et certains symboles.

Le premier code Baudot a été développé par Émile Baudot en 1874 pour les lignes de télégraphie électrique : il s'agit de l'Alphabet international no 1.

Les caractères étaient composés à l'aide d'un clavier à cinq touches, où chaque touche correspondait à l'un des cinq bits de chaque caractère.

En 1877, l'installation quintuple permet cinq fonctionnements simultanés et donc un débit cinq fois plus grand[sv1919 1].

Différents arrangements ont ensuite été normalisés et adoptés pour les communications internationales, comme l'alphabet international no 1 et l'alphabet international no 2.

La technologie du ruban perforé est abandonnée avec le Télex, un réseau de communication entre téléscripteurs, mis en place à partir des années 1930 et encore en service au début du XXIe siècle, bien que massivement remplacé par d'autres technologies.

La notion de codage des caractères était née. Différentes évolutions techniques ont permis d'augmenter le nombre de caractères représentables en passant de cinq à six (six bits), puis sept et huit bits (octet), pour représenter respectivement 32, 64, 128 et 256 symboles.

Le principe de codage des caractères par un système binaire abstrait de taille fixe est toujours utilisé de nos jours dans les systèmes de télécommunications bien que le nombre de caractères et leur système de représentation ait considérablement évolué.

Objectif

Cet appareil a permis de composer des dépêches.

L'utilisation du multiplexage a permis d'atteindre 3 000 mots par heure en duplex contre 1 000 mots par heure en morse duplex.

Ce chiffre s'obtient en comptant 25 mots pour 165 lettres. Cette vitesse était obtenue grâce à une roue qui permettait de multiplexer plusieurs communications (de l'ordre de quatre ou six simultanées).

Le dispositif était basé sur un clavier à cinq touches pouvant être pressées simultanément et qui chacune pouvait produire un courant positif ou négatif (voir bit). Cette information binaire est représentée ci-dessous par pour l'absence de perforation, ou par pour une perforation, enchaînées par séquence de 5.

Ce code de 32 valeurs était composé de 2 plages de 28 caractères imprimables et de quatre codes de contrôle.

Les quatre codes de contrôle permettaient[1] :

  • ⬜⬜⬜⬜⬜ de gérer une espace ou un état de repos (NULL) ;
  • ⬜⬜⬜⬜⬛ de basculer au mode lettres (LTRS) ;
  • ⬜⬜⬜⬛⬜ de basculer au mode figures (FIGS) pour les chiffres, ponctuations et symboles ;
  • ⬜⬜⬜⬛⬛ d'indiquer une erreur de composition du caractère précédemment transmis (DEL).


Évolution

Les codes initiaux ont été le code Baudot et l'alphabet n°1.

Vers 1901, l'inventeur Donald Murray (en) modifie le code Baudot original en réorganisant les caractères, ajoute de nouveaux symboles parmi les 32 possibles , et introduit les jeux de caractères[réf. souhaitée]. Comme il souhaitait utiliser un clavier de machine à écrire, il n'y avait plus de correspondance physique entre le code et la disposition des touches. Il organisa donc les caractères pour que les caractères les plus courants génèrent un nombre minimal de perforations parmi les cinq possibles, ce qui minimise l'usure du matériel.

En 1911, aux États-Unis, la machine Morkrum est munie d'un clavier de machine à écrire d'un code à cinq perforations et d'un imprimeur, capable d'annuler un caractère en poinçonnant les cinq trous, le tout fonctionnant à une vitesse de 360 lettres à la minute ou six lettres à la seconde. La transmission quadruplex permet d'augmenter le débit en faisant passer deux émissions et deux réceptions sur un même fil[sv1919 1].

La Western Union modifia le code de Murray, en éliminant certains caractères. Le code obtenu est le code actuel  parfois dit Baudot . On présente plus bas le code US TTY, très proche du code CCITT.

En 1917, la Western Electric est dotée d'un système simplex contenant en plus des cinq informations du code, une information de start et une information du stop permettant de démarrer et d'arrêter la transmission des cinq bits à l'aide de deux électro-aimants, pour les lignes de grande longueur[2].

En 1917, la réception dispose également d'une touche LF (line feed) et d'une touche CR (carriage return)[3].

En 1921, aux États-Unis, trois systèmes basés sur une transmission start-stop ont atteint le succès commercial. Il s'agit notamment du système Morkrum et du système Western Union[4].

Lors de la standardisation de ce code à un niveau international, le code US TTY a été modifié pour donner le code CCITT no 2. Il en diffère par une inversion (BEL et ') et des définitions additionnelles dans les FIGS (#, & et !), laissées volontairement non définies par le CCITT no 2 pour permettre des usages nationaux/locaux.

En hommage à Émile Baudot, une partie de son nom désigne l'unité de mesure du débit de signal, le Baud (symbole Bd).

Utilisation et application

En , après avoir expérimenté avec succès l'appareil entre Marseille et Alger, on décide de développer l'usage de l'appareil Baudot sur les câbles sous-marins d'Algérie[5].

L'appareil Baudot peut être utilisé avec deux fils : un fil sert alors à la transmission, et l'autre à la réception[5]. Le code Baudot est utilisé dans le réseau Télex. Il est également mis en œuvre dans certaines versions du radiotélétype.

Le principe de perforation sur un nombre fixe de bits a été repris, en changeant à la fois le système de codage et le format du support, dans le système des cartes perforées. Il a également inspiré le Manchester Mark I.

Variations et standardisations

Le principe du code Baudot basé sur cinq bits, avec deux contextes (lettres et chiffres) a continué à être utilisé avec certaines variations. Pour une bonne compréhension entre des parties différentes, une standardisation a dû s'imposer.

Le principe du code Baudot est repris à un niveau dans les Alphabets internationaux no 1 et no 2.

À un niveau local, on le retrouve dans le Code US TTY.

Code original et Alphabet international no 1

Code continental et britanniques

Le code Baudot se compose de 31 symboles et d'un code de changement de jeu de caractères.

Les lettres sont codées en classant les voyelles et les consonnes séparément dans l'ordre alphabétique et en suivant l'ordre du code de Gray, trois quarts de siècle avant que celui-ci ne soit breveté aux États-Unis.

Aucun lien apparent ne semble unir le codage des lettres et le codage des chiffres.

Les cinq premiers chiffres sont codés sur trois bits dans un ordre d'origine méconnue. Les cinq chiffres suivants sont codés dans le même ordre, mais avec le bit no 4 positionné.

Le code de la British Post Office est détaillé dans la table dénommée "Code Baudot (Arrangement européen et britannique)".

Alphabet international no 1

L'alphabet n°1 est un accord international qui réserve certains caractères à un usage local.

Code de Murray

Q
W
E
R
T
Y
U
 I 
O
P
Code baudot variante 2, reproduisant l'ordre des touches d'un clavier QWERTY

L'alphabet international no 2 est incompatible avec l'Alphabet international no 1 (Code Baudot original).

La logique des lettres de l'Alphabet international no 2 n'est pas apparente au premier abord. Un seul bit est positionné (perforé) pour E et T, dix autres lettres AOINSHRDLU ne sont représentées qu'avec deux bits positionnés. Cette disposition "ET AOINSHRDLU" est donc dans un ordre ressemblant fortement à la séquence ETAOIN SHRDLU déjà connue à l'époque[8].

Il faut donc comprendre que les combinaisons nécessitant le moins de perforations sont associées aux caractères les plus fréquents[11],[8].

Chaque lettre prenait un demi-pouce sur les bandes perforées[12][source insuffisante].

Le télégraphe de Murray a été en compétition avec nombre d'autres systèmes. Mais il permet d'effacer un caractère sans que cela n'apparaisse dans le message final, pour plaire aux businessmen. Il a été essayé par les administrations allemandes et britanniques (y compris en Inde), notamment sur le câble Londres-Edinbourg durant quinze mois, mais aussi sur le câble Emden-Londres. Le jeu complet d'appareil coûte alors 1 400 livres britanniques. Le jeu complet d'appareil coûte entre 700 et 800 livres britanniques. À titre de comparaison le clavier Morse ne coûte que dix livres environ. Ce système a été développé en partie à Sydney, New-York, Londres et Berlin. Le système a notamment intéressé l'ingénieur Kraatz et le Kolnische Zeitung. Le système permettait également d'écrire en forme de page à un rythme de 120 mots par minute, dans un sens (donc 240 mots en cas de transmission dans les deux sens (duplex)), sur une distance d'un millier de miles britanniques[13].

Murray a également déposé un brevet sur la synchronisation automatique permettant de perfectionner les systèmes Baudot et Picard[14].

Le code Baudot a été utilisé en France, dans les capitales européennes majeures ainsi que dans différents pays notamment la Russie, l'Inde et le Brésil. En France, avec le système Baudot plusieurs villes peuvent être branchées sur une seule ligne (un seul câble). De plus, une des avancées majeures de Murray est le fait de perforer le message reçu, ce qui permet de le retransmettre automatiquement et sans erreur, vers plusieurs destinations. Dès 1914, la Western Union dispose d'un lien entre Boston et New-York, ce qui lui permet d'échanger 3 000 messages par jour. Entre Londres et Birmingham, 5 000 messages par jour sont échangés[15]. Ceci contribue à un effet de réseau.

L'Alphabet international no 2 associe les chiffres et les lettres de la même manière que le clavier Qwerty de machine à écrire.

L'Alphabet international no 2 finira par être remplacé par l'Alphabet international no 5, utilisant sept bits au lieu de cinq.

Code US TTY et Alphabet international no 2

Code US TTY.

Code US TTY

Le code US TTY est une adaptation régionale aux États-Unis. Il se distingue par la présences des caractères Livre (£), Dollar ($), Bel (Sonnerie), CR et LF, pour prendre en charge les deux éléments d'un retour à la ligne.

Comme le code de Murray, il correspond à une disposition de clavier QWERTY, en suivant l'ordre des chiffres 123456.

Alphabet international no 2

Comme indiqué dans l'article anglophone, l'alphabet international no 2 dispose de plusieurs variantes.

En particulier, quatre caractères sont déjà réservés aux services intérieurs de chaque administration dès 1934; il s'agit des caractères associés aux lettres D, F, G, H [16] (de code 09, 0D, 14 et 1A).

Les deux tables ci-dessous reproduisent la partie chiffre de la variante alphabet Alphabet international no 2 et la variante américaine.

Sont colorés les caractères différant de l'un à l'autre.

Variante ITA2 du code Baudot–Murray (jeu de chiffres, avec caractère d'échappement en code 0x1B)
_0_1 _2_3 _4_5 _6_7 _8_9 _A_B _C_D _E_F
 
0_
 
NUL 3 LF SP ' 8 7 CR ENQ 4 BEL , ! : (
 
1_
 
5 + ) 2 £ 6 0 1 9 ? & SO ou FIGS . / = LTRS
Variante US-TTY du code Baudot–Murray (du code Baudot–Murray (jeu de chiffres, avec caractère d'échappement en code 0x1B)
_0_1 _2_3 _4_5 _6_7 _8_9 _A_B _C_D _E_F
 
0_
 
NUL 3 LF SP BEL 8 7 CR $ 4 ' , ! : (
 
1_
 
5 " ) 2 # 6 0 1 9 ? & SO ou FIGS . / ; LTRS

Légende :

  • Alphabétique
  • Caractère de contrôle
  • Chiffre
  • Ponctuation
  • Ponctuation étendue
  • Charactère graphique
  • International
  • Non défini

Variante cyrillique

La correspondance cyrillique (russe) aux caractères latins est fournie par le système de codage MTK-2.

Liaison série

Les bits de mise en marche (start) et d'arrêt (stop) ont été introduits en Amérique en 1907 par Charles L Krumm et son fils H Krumm. Il a été fabriqué par Morkrum company devenu Teletype corporation, et trouve son application pratique vers 1920[17].

Ceci réduit la sensibilité de l’émetteur et du récepteur à la synchronisation de la rotation, et permet donc des vitesses plus rapides en bénéficiant d'une resynchronisation automatique[17].

Liaison série néerlandaise

W I K I
00000 1100110 000 1001100 1011110 00 1001100
  • Inactif
  • Startbit
  • Stopbit
  • Liaison série Madrid - ITA 2

    Des sources indiquent le fonctionnement en circuit fermé et en circuit doublé, mais n'indiquent pas l'état de repos[16],[17].

    Donnée W I K I
    Codage x x x x x 0110011 x x x 0011001 0111101 x x 0011001
    Décodage reposM11001A reposM01100A M11110A reposM01100A
    Reçu W I K I
    Légende Madrid[16]
    Symbole Circuit fermé [16] Courant double [16] M/ADébut/fin
    0 Pas de courant [17] Courant négatif [17] MMise en marche[16], dit bit de start, de l'anglais[17]
    1 Courant positif Courant positif[17] 1Arrêt[16], dit bit de stop, également de l'anglais[17]
    x Non précisé par la source[16]

    Controverse avec l'invention de Monsieur Mimault de Poitiers

    Voir aussi

    Notes et références

    Related Articles

    Wikiwand AI