19 avril 2004

Saisie Multilingue sous Linux

Ce qui suit a est destiné aux utilisateurs de Linux, cependant une bonne partie des informations doivent être valables pour tous les Unix, en particulier les xBSD.

Encodage

Pour résumer le problème des encodages, il faut rappeler que l'informatique nous vient des États-Unis. Par conséquent, les premiers ordinateurs utilisaient l'ASCII, codé sur 7 bits qui permettent de travailler sur 128 caractères. Les caractères accentués n'étaient pas utilisables, les caractères non romains encore moins.

Forcément, les Européens voulaient pouvoir saisir des accents, donc l'ASCII à été étendu a 8 bits, soit 256 caractères. C'est l'ISO_8859-1, qui est maintenant remplacé par l'ISO-8859-15. Mais bien sûr, pour les Japonais (ainsi que pour les Grecs, les Russes, les Coréens, les Arabes et quelques milliards de personnes qui ont une langue qui ne se base pas sur l'alphabet romain) ça n'a pas apporté grand chose. Chacun a donc établi sa propre norme, et le Japon ne compte pas moins de trois normes ! ISO, EUC-JP et SJIS. Sous Unix, c'est généralement EUC-JP qui est préféré.

Saisie du Français

J'imagine que vous savez déjà comment saisir du français : si vous avez un clavier français, aucun problème. Si vous utilisez un clavier américain, japonais ou autre, voici une astuce pour saisir le français ajoutez "keycode 0x73 = Multi_key" au fichier .Xmodmap qui se trouve dans votre répertoire "home". S'il n'existe pas, créez-le. Ensuite, lancez xmodmap ~/.Xmodmap depuis un terminal.

Saisie du Japonais

Il faut deux choses pour saisir du japonais :

  1. Un serveur qui tourne en fond et fait la conversion kana -> kanji quand on lui le demande.
  2. Une application côte interface graphique qui récupere la saisie, et demande au serveur de conversion les possibilités et permet à l'utilisateur de sélectionner de façon commode la bonne combinaison.

Serveur de conversion kana - kanji

Au choix, Canna, FreeWnn ou SKK. Pour ma part, j'utilise généralement Canna. L'installation dépend généralement de la distribution, mais notez bien que le serveur doit tourner en tâche de fond. Là encore, la façon de l'ajouter au scripts de démarrage dépend de votre distribution/système, mais c'est généralement automatique.

Chez moi c'est Canna, j'ai donc la ligne suivante quand je fais un 'ps aux' :

root 5035 0.0 0.1 1820 780 ? S 00:59 0:00 /usr/sbin/cannaserver

Interface graphique

kinput2

kinput2 était jusqu'il y a peu la seule interface graphique libre à fonctionner pour toutes les applis X Windows, donc on pouvait difficilement s'en passer. J'en parle ici parce que j'essaye d'être exhaustif, mais je vous recommande plutôt im-ja. Le seul intérêt de kinput2 sur im-ja, c'est qu'il ne dépend que de la Xlib. Le problème, c'est que c'est assez laid et très minimaliste. Mais ça marche. Pour kinput2, il faut necessairement avoir les variables d'environnement en japonais. Voici un exemple de script pour lancer un logiciel avec kinput2 :

#!/bin/sh
# Environnement japonais, mais messages en francais !
export LANG=ja_JP.utf8
export LC_MESSAGES=ja_JP.eucJP
export LC_CTYPE=ja_JP.eucJP
export LANGUAGE=fr
# On lance kinput2
export XMODIFIERS=@im=kinput2
kinput2 -xim -kinput -canna &
ooffice

Pour avoir en tout le temps la saisie en japonais, il suffit d'ajouter ces lignes a votre .xsession.

gtk-im et im-ja

gtk-im est le système de saisie pour les applications gtk+2 : très moderne et très pratique. Une fois que tout est installé, il suffit de faire un clic droit dans n'importe quel champ (en plein milieu de gedit par exemple) et on peut choisir "methode de saisie"->"japonais". C'est complètement indépendant des variables d'environnement.

On peut aussi configurer gtk pour lui dire que la methode de saisie par défaut c'est le japonais et ce sera indépendement des variables d'environnement.

03 mars 2004

Voyage en train

Aujourd'hui jeudi, et jusqu'à samedi, je pars en conférence nationale dans la préfecture de Mie, au centre du Japon sur la cote Pacifique.

Dans l'équipe chacun étant parti de son côté, j''ai pris le train seul, en Shinkansen (le TGV local) depuis la gare de Tokyo jusqu'à la ville de Nagoya, pour ensuite prendre successivement deux trains bien plus locaux qui s'enfoncent dans la campagne japonaise. J''ai su par la suite que j'aurais pu eviter de prendre ce train local de la JR, et économiser ainsi quelques dizaines de minutes... Mais je ne pense pas avoir perdu au change.

Ce petit trajet en train au milieu des villages, les arrêts fréquents dans les minuscules gares avec tout juste une petite cabane pour le chef de gare me fait oublier Tokyo et ses habitants, si différents des petits vieux agriculteurs, au dos courbé par leur travail, dont la vie paraît si simple. Ça fait du bien de voir autre chose. Ça m''a aussi rappelé les petites gares complètement désertes dans les campagnes françaises, les rails envahis par la végétation et la vieille locomotive qui rouille dans un coin. Pourquoi dans les campagnes japonaises, les gares ne sont pas désertées ? J'imagine que dans un pays dont la population est le double pour un territoire reduit de moitié par rapport à la France, la Japan Railway a moins de mal à trouver des voyageurs pour rentabiliser les petites lignes de campagnes ? L'effet d''entraînement doit aussi entrer en jeu : le réseau ferroviaire japonais est tres developpé, donc pratique, donc on l'utilise, donc il est rentable... Et les compagnies n'ont pas à fermer de lignes.

Arrivé à destination, j'ai retrouvé mon professeur qui au cours d'une conversation à propos de la campagne, me fait remarquer que le terme que j''ai l'habitude d'utiliser depuis toujours ("inaka") est en fait péjoratif... Genre, "un trou paumé". Il vaut mieux utiliser "chiho" me dit-il, terme que je ne connaissait pas. Forcément, je ne cotoie que des Tokyoïtes et pour eux la campagne ne peut être qu'un endroit paumé ! Et les véritables campagnards que j'ai croisé ont du user de leur légendaire politesse, et de leur crainte de contrarier pour abonder dans mon sens : "en effet mon cher, la campagne est un endroit si triste" tout en pensant "Sale parigot !"

20 février 2004

Mozilla et les Ruby

Les ruby sont des guides de lectures utilisés pour préciser la prononciation des kanji (caractères chinois) en japonais.

Le moteur de rendu Gecko (et par conséquent Mozilla, Firefox et compagnie) ne gèrent pas le Ruby en natif, c'est vrai. Il s''agit du bug 33339, qui n'est pas résolu parce que personne n'a encore produit de patch jugé acceptable pour être intégré au tronc.

Il existe donc une extension appelée tout simplement XHTML Ruby Support par l'ami Piro qui est un très bon développeur d'extensions XUL. Seulement voilà, cette extension se base sur des feuilles de style et des tables imbriquées, ce qui est plus un bidouillage (comment dit-on "work-around" en français ?) qu'une véritable implémentation de la recommandation. C'est pour ça que cette extension reste une extension, et n'est pas intégrée à Gecko.

En revanche, cette extension étant basée sur des feuilles de style, un webmaster voulant afficher des ruby peut intégrer ces feuilles de style à son site. Effectivement, ca gêne un peu la lecture des navigateurs qui ne gèrent pas les feuilles de style ; Mais on n'y peut rien, la recommandation ruby est faite pour avoir cette apparence sous les navigateurs sans support de ruby (par exemple, 酔(よ)っ払(ぱら)った pour 酔っ払った).

08 février 2004

Mozilla Firefox

La dernière version de Mozilla Firebird est sortie... Et le navigateur a encore changé de nom ! Il s'agit maintenant de Mozilla Firefox. Au programme des nouveautés : un thème plus homogène pour MacOS X, un installeur pour Windows, et pour toutes les versions un nouveau gestionnaire de téléchargement, les signets amélioré et le DOM inspector est inclut.

Get Firefox

06 février 2004

Akira

Cette semaine, après un cours de français donné dans le quartier de Shibuya, j'ai trouvé dans une librairie une édition récente de la bande dessinée japonaise Akira. C''est l'un des manga les plus connus hors du Japon, principalement parce qu'il a un format qui s'approche de ce qui se fait en Occident.

Au Japon, un manga est un produit "consommable". Une histoire suit généralement le schéma suivant : elle est publiée par épisodes dans un magazine de manga, si elle a du succès dans ce magazine elle parait sous-forme de petits livrets de la taille d'un livre de poche regroupant plusieurs épisodes. Le dessin, quant à lui, est en noir et blanc, très simple mais suffisant pour montrer avec précision les expressions de visage. Il est en outre très dynamique, plusieurs vignettes sont généralement nécessaires pour décrire une action. Ce dernier détail explique pourquoi les manga sont si épais pour un temps de lecture qui est le même.

On a donc d'un côté le manga japonais, au dessin monochrome très simple et très dynamique, dans un petit format qu'on lit dans le train en commutant ou dans un café, et de l'autre côté la BD européenne, d'un grand format, avec de longue bulles sur des images qui sont presque des tableaux. (Je parle de la BD pour adultes, comme celle d'Enki Bilal - pas de la BD belge grand public.) D'un côté le manga japonais qu'on lit et qu'oublie vite pour passer à un autre, et de l'autre la BD européenne qui s'apprécie comme un bel objet, et qui se lit tranquillement chez soi en prenant son temps.

Pour finir, il reste un détail de mise en page : bien que récemment certaines publications adoptent une mise en page à l'occidentale, écrivant horizontalement et de gauche à droite, le japonais s'écrit traditionnellement verticalement, de haut en bas et de droite à gauche. Les manga sont écrits de façon traditionnelle, par conséquent un manga se lit de droite à gauche et l'ordre des vignettes est inversé par rapport aux publications européennes. De plus en plus de manga sont publiés dans leur version française en gardant le sens original de lecture.

Entre les deux, Akira est assez particulier ; c'est à ma connaissance le seul manga vendu au Japon dans un grand format. De plus, étant un des premiers manga à se vendre hors du Japon, sa version d'exportation a été adaptée : les vignettes sont colorisées et un effet de miroir a été appliqué aux planches pour les passer dans le sens de lecture occidental.

Revenons-en à cette nouvelle édition ; Akira dans sa version japonaise était en noir et blanc. Dans sa version d'export en couleur. Les Européens et les Américains seraient donc mieux lotis que les Japonais ? Plus maintenant ! L'édition qui vient de sortir est une édition... Japonaise, basée sur la version colorisée pour l'export. En parallèle, la vieille édition en noir et blanc ressort a un prix réduit, 1000 yen l'exemplaire (ce qui reste cher comparé à un manga petit format). Il est donc en japonais, mais se lit de gauche à droite, et le texte est écrit horizontalement !

Si vous aimez la BD européenne mais que vous n'aimez les manga, que vous les trouvez trop baclés, et que vous n'avez toujours pas lu Akira, c''est le manga idéal pour découvrir le style du dessin japonais dans un beau livre, grand format, avec des couleurs aussi travaillées que dans les BD européennes.