Le langage - La théorie de l'information - page 2
Comment parlent les ordinateurs ? Samuel Morse a inventé le premier langage binaire pour envoyer les premiers messages longue distance. Avant, il fallait de longues courses à cheval ou les signaux de fumée des Indiens, chers aux westerns. Caractère Fin Transmission Sonnerie … Espace + 12…AB… Système binaire 00000100 00000111 00100000 00101011 00110001 00110010 01000001 01000010 Cette idée du code binaire fut reprise pour les ordinateurs, les télécommunications et plus tard les médias informatiques (CD, DVD…) car l’ordinateur ne parle qu’avec deux « syllabes », le « 1 » (le courant passe), et le « 0 » (le courant ne passe pas). C’est ainsi que dans les années 1960 naît le code ASCII (American Standard Code Information Interchange) et qui connaîtra des évolutions. Le langage informatique est codé sur des paquets (chunks, cf. chap. 5) de huit caractères (octets), ce qui permet deux cent cinquante- six combinaisons (28). Les premiers octets codent des signaux issus des communications classiques « début » ou « fin de transmission », et les autres représentent les signes de ponctuation, l’alphabet et les chiffres décimaux. C’est ainsi qu’est codé votre rapport de deuxième année ou vos notes de cours, mais aussi vos musiques, photos, etc. Par exemple « psi » en langage ordinateur, c’est « 01110000 01110011 01101001 » ; il lui faut donc une bonne mémoire pour retenir de longs passages ! ! ! Fréquence et redondance C’est un procédé connu depuis des siècles pour le déchiffrage des messages secrets que de remplacer les signes les plus fréquents par les lettres les plus fréquentes dans la langue, par exemple, la lettre e. Dans ce contexte d’étude du langage sur le plan informatif, et en particulier pour les applications en télécommunication, la description statistique du langage s’est développée. Il existe de nombreux paramètres statistiques, (Miller, 1956 ; Bresson, 1972). La fréquence est le nombre de fois où un mot, une lettre, un phonème apparaît par rapport aux autres : par exemple, sur quarante-deux phonèmes en anglais, i est la plus fréquente des voyelles (8,53 %) et n est la consonne la plus fréquente (7,24 %) (Dewey, 1923, cit. Miller, 1956). La fréquence des mots s’appelle la fréquence d’usage et les études peuvent concerner la fréquence d’occurrence des mots dans la