Comment parlent les ordinateurs ?
Samuel Morse a inventé le premier langage binaire pour envoyer les premiers messages
longue distance. Avant, il fallait de longues courses à cheval ou les signaux de fumée
des Indiens, chers aux westerns.
Caractère
Fin Transmission
Sonnerie
…
Espace
+
12…AB…
Système binaire
00000100
00000111
00100000
00101011
00110001
00110010
01000001
01000010
Cette idée du code binaire fut reprise pour les ordinateurs, les télécommunications et
plus tard les médias informatiques (CD, DVD…) car l’ordinateur ne parle qu’avec deux
« syllabes », le « 1 » (le courant passe), et le « 0 » (le courant ne passe pas). C’est ainsi que
dans les années 1960 naît le code ASCII (American Standard Code Information Interchange)
et qui connaîtra des évolutions. Le langage informatique est codé sur des
paquets (chunks, cf. chap. 5) de huit caractères (octets), ce qui permet deux cent cinquante-
six combinaisons (28). Les premiers octets codent des signaux issus des communications
classiques « début » ou « fin de transmission », et les autres représentent les
signes de ponctuation, l’alphabet et les chiffres décimaux. C’est ainsi qu’est codé votre
rapport de deuxième année ou vos notes de cours, mais aussi vos musiques, photos, etc.
Par exemple « psi » en langage ordinateur, c’est « 01110000 01110011 01101001 » ; il lui
faut donc une bonne mémoire pour retenir de longs passages ! ! !
Fréquence et redondance
C’est un procédé connu depuis des siècles pour le déchiffrage des messages
secrets que de remplacer les signes les plus fréquents par les lettres
les plus fréquentes dans la langue, par exemple, la lettre e.
Dans ce contexte d’étude du langage sur le plan informatif, et en particulier
pour les applications en télécommunication, la description statistique
du langage s’est développée. Il existe de nombreux paramètres statistiques,
(Miller, 1956 ; Bresson, 1972). La fréquence est le nombre de fois où un
mot, une lettre, un phonème apparaît par rapport aux autres : par exemple,
sur quarante-deux phonèmes en anglais, i est la plus fréquente des voyelles
(8,53 %) et n est la consonne la plus fréquente (7,24 %) (Dewey, 1923, cit.
Miller, 1956). La fréquence des mots s’appelle la fréquence d’usage et les
études peuvent concerner la fréquence d’occurrence des mots dans la