Le nombre de caractères formant la langue chinoise est compris entre 40.000 et 60.000. | bobchao via Flickr
Le nombre de caractères formant la langue chinoise est compris entre 40.000 et 60.000. | bobchao via Flickr

Zhi Bingyi, le prisonnier qui a rendu le chinois utilisable sur un clavier (grâce à une tasse à thé)

La langue comporte des dizaines de milliers de caractères.

S'inspirant d'un livre intitulé Kingdom of Characters, Wired retrace la folle trajectoire de Zhi Bingyi, prisonnier politique chinois qui, il y a plus d'un demi-siècle, a offert à son pays une grande avancée: un codage de la langue chinoise la rendant utilisable par les systèmes informatiques.

Arrêté en juillet 1968 car considéré comme un intellectuel réactionnaire, Zhi était titulaire d'un doctorat de sciences physiques, obtenu à l'université allemande de Leipzig. Son diplôme en poche, cet homme soigneux et obstiné avait refusé une offre d'emploi émanant des États-Unis pour regagner son pays natal, où il était devenu enseignant-chercheur.

Une fois enfermé, Zhi fut privé non seulement de toute information, mais aussi de toute possibilité de poursuivre ses recherches. Dans sa cellule pour le moins spartiate, sa seule compagnie était celle des huit caractères inscrits sur l'un des murs, qui formaient la phrase suivante: «La clémence à ceux qui avouent, la sévérité pour ceux qui refusent.»

Des lignes et des points

À force de fixer encore et encore ce message, Zhi Bingyi finit par en développer une vision différente, décomposant chaque caractère sous la forme de points et de traits.

S'il ne fut pas le premier à s'y coller (le marquis d'Escayrac, linguiste et géographe français, avait notamment publié sur le sujet un siècle plus tôt), le prisonnier eut l'idée de développer un système de transcription du chinois dans le but de le rendre numérisable. Car avec ses dizaines de milliers de caractères, la langue se prêtait apparemment mal à l'utilisation d'un clavier classique.

Les techniques précédentes, dont celle d'Escayrac, présentaient de nombreux avantages, mais elles ne permettaient pas de répondre à des impératifs informatiques de plus en plus pressants.

Il ne fallait plus se concentrer uniquement sur les besoins de l'être humain, mais également sur ceux de la machine. Sur les plans aérien, militaire et industriel, la Chine ne pouvait décemment pas se priver d'un système informatique fiable, ni abandonner sa langue au profit d'un anglais qui aurait certes été plus pratique.

Dans sa geôle, Zhi se mit alors à plancher sur un système permettant d'écrire tous les caractères chinois à l'aide d'un clavier muni d'un alphabet romain classique: soit à l'aide de 0 et de 1 pour coder chaque caractère, soit grâce à des séries de lettres. Zhi Bingyi décida rapidement que cette deuxième solution était préférable et se demanda comment coder avec des lettres.

Mais combien allait-il en falloir pour représenter un seul et unique caractère? Et comment transcrire efficacement chaque caractère en lettres romaines?

Difficile de répondre à de telles questions quand on est enfermé sans stylo ni support pour écrire. Même le papier toilette était proscrit. Zhi avait désespérément besoin de coucher ses réflexions sur le papier, ou en tout cas de pouvoir s'adonner à des essais, mais cela lui était rendu impossible.

Dans sa cellule, seule une tasse à thé semblait pouvoir faire office de support. Alors, chaque jour, avec un stylo volé, Zhi tentait de transcrire de nouveaux caractères en écrivant sur la céramique de la tasse, puis mémorisait le résultat de ses travaux avant d'effacer soigneusement toute trace de son travail.

La forme et le son

C'est ainsi que peu à peu, Zhi parvint à mettre au point une méthode de transcription du chinois. Celle-ci était basée à la fois sur la phonétique et sur la structure géométrique des caractères, tous formés de traits et de points. Un double système nécessaire afin de slalomer entre les difficultés, et notamment de composer avec les nombreux homophones de la langue chinoise.

Le dissident fut finalement relâché en septembre 1969, après quatorze mois d'enfermement. On lui confia alors de basses besognes, loin du niveau d'études qui était le sien.

Homme de ménage, ouvrier non qualifié, surveillant d'entrepôt... Chaque emploi était fait pour rappeler à Zhi qu'il ne retrouverait jamais son statut d'antan. Mais l'homme profita au contraire de cette situation pour consacrer tout son temps de cerveau disponible à sa nouvelle obsession: la transcription du chinois.

L'entrepôt dans lequel il travaillait lui servit en quelque sorte de bureau: il put notamment y lire de la presse étrangère, ce qui lui donna l'occasion de découvrir que le Japon avait réalisé de grands progrès en matière de transcription de ses propres caractères... même si cela nécessitait encore un clavier muni de 3.600 touches.

Mais les exemples venus de l'Australie et des États-Unis, où quelques dizaines de touches permettaient apparemment de produire des centaines de caractères, avaient quelque chose d'encourageant.

Dix ans de recherche

Il lui fallut plusieurs années supplémentaires pour venir à bout de son idée. La langue chinoise n'était pas facile à apprivoiser: chaque caractère était composé de deux à quatre composants, ceux-ci étant à piocher parmi une liste de 300 à 400 éléments.

Mais par un travail de séquençage, Zhi parvint à mettre au point un code évitant au maximum toute confusion. Chaque composant était représenté par une série de lettres suffisamment bien choisie pour que sa juxtaposition avec d'autres séries n'engendre pas différentes façons de lire le résultat.

C'est finalement en 1978 que Zhi Bingyi publia son premier article scientifique à propos de ses recherches. Dans la revue Nature, il détailla le système mis en place, dont le résumé est prodigieux: en utilisant des séries de quatre lettres choisies parmi les vingt-six de notre alphabet, il était possible de générer 456.976 codes différents, ce qui permettait de transcrire l'intégralité des caractères chinois existants. Zhi décrivit son code comme aussi efficace que l'alphabet Morse: rapide, intuitif et lisible.

C'est ainsi qu'on put lire, le 19 juillet 1978, le titre suivant à la une du Wenhui Daily (quotidien édité à Shanghai): «L'écriture chinoise est entrée dans le système informatique». Une apothéose née de griffonnages compulsifs sur une tasse à thé en céramique.

En ce moment

🔫 De l'importance des gros canons 💣 Le coup d'État contre Poutine 🐦 Elon Musk qui plombe Twitter: l'hebdo de korii.

Et Cætera

🔫 De l'importance des gros canons 💣 Le coup d'État contre Poutine 🐦 Elon Musk qui plombe Twitter: l'hebdo de korii.

Dix (courts) articles pour voir le monde d'un autre œil et chasser l'ennui de votre dimanche.

🔥 Et si l'Ukraine envahissait la Russie? ⚡ Les douteux lasers russes anti-drones 🏃 La course à l'exaflop, hier sur korii.

Et Cætera

🔥 Et si l'Ukraine envahissait la Russie? ⚡ Les douteux lasers russes anti-drones 🏃 La course à l'exaflop, hier sur korii.

Quatre articles pour comprendre le monde autrement.

Supercalculateurs: les États-Unis courent derrière une Chine triomphante

Tech

Supercalculateurs: les États-Unis courent derrière une Chine triomphante

Géopolitique et concours de bits.