Lettre aux Arméniens de tous les Pays :

 

Je veux vous parler  de l’avenir de la langue arménienne et de son insertion dans une informatisation globale. C’est le pari que je lance à la Communauté arménienne.

 

Au travers de comparaisons, de constats et de signes d’espoir qui suivent vous comprendrez les causes de ces craintes et les solutions proposées pour réussir cette insertion.

 

Bien que le constat actuel soit sombre la cause n’est pas perdue.  Je propose des solutions pour remettre le tout sur pieds. Comme toute action de cette envergure, rien de cette importance ne pouvant se faire seul, je lance un appel à toutes les bonnes volontés désirant prendre part pour créer l’équipe qui s’attelera à la tâche.

 

Je vous demande de lire ce texte attentivement jusqu’au bout pour savoir en détail ce qui peut devenir une fin ou une résurection de notre langue et comment influencer cet avenir.    Merci.

 

Préambule :

 

L’ordinateur, qu’il soit MAC ou WINDOWS, fonctionne à l’aide d’un système d’exploitation qui lance et gère le fonctionnement de la machine. Ce système d’exploitation est composé de fichiers principaux indispensables au lancement et fonctionnement de la machine et de sous-programmes appelés au fur et à mesure des besoins.

 

Le sujet porte sur le sous-programme nommé «Langues».  Voyons pourquoi nous ne pouvons, alors que cela est possible à de nombreuses langues, lire, écrire, corriger, mettre en forme un texte arménien avec des outils similaires à ceux que Windows apporte à ces langues.

 

Je ferai  une comparaison imagée sur la construction de ce sous-programme. Elle permettra d’expliquer qu’un ensemble  «langue Arménienne» doit avoir plus de composants que ce qui lui est affecté.  Cette construction doit se faire dans un ordre précis, comme pour la planification de la construction d’un immeuble, autrement ce ne sera qu’un pavillon en rez-de-chaussée.

 

J’expliquerai aussi que si des personnes se contentent actuellement d’écrire l’arménien avec les moyens existants, trouvant cela suffisant, ils ne le pourront plus très bientôt. L’évolution du sytème d’exploitation le tolère de moins en moins et bientôt ceux-ci ne seront plus fonctionnels.

Pour preuve la demande des USA d’un système contemporain arménien pour travailler avec WIN 2000 et WIN XP. 

 

Introduction :

 

Depuis que l’ordinateur personnel est entré dans notre vie, nous pouvons écrire nos textes avec une machine qui tolère les erreurs de frappe et permet de les corriger directement dans le texte sans avoir à reprendre la saisie du courrier. Cette machine doit, aussi, s’adapter  aux particularités de la langue de l’utilisateur final. Nous savons que ces langues sont nombreuses et que de très nombreux alphabets sont utilisés dans la monde.

 

Cette obligation incombe au sous-programme « Langues » devenu, avec la croissance du nombre de langues intégrées dans Windows, un sous-ensemble important.  Si nous ajoutons l’apparition d’outils complémentaires d’amélioration de la saisie de texte, il devient incontournable pour l’usage d’un traitement de texte.

 

C’est dans ce but que seront créées les tables de caractères (Codepages). Ces tables, très nombreuses, sont chacune propre à un alphabet spécifique ou une langue particulière au sein du même alphabet. 

Les premiers codepages furent créés lorsque l’informatique travaillait en 8 bits (c’était un grand pas avec une puissance quadruplée).  Ces tables contiennent 256 cases soit la possiblité d’y placer 256 signes et caractères.

 

Un codepage est occupé dans sa première moitié, soit 128 cases, par le jeu de caractères "latin 1" et de commandes logiciel. Cela est vrai pour tous les codepages sans exception. Cette partie, nommée ASCII, est indispensable au fonctionnement de Windows ainsi qu'à l’écriture des menus à l’écran. Cela ne laisse plus que 128 cases de libres. La seconde partie, nommée Extension, porte les caractères de la langue qu’il représente. Ces deux parties ensemble forment le Codepage ANSI.

 

Voyons l’exemple des langues Latino-Romanes et à caractères Latino-Romans. Ces langues utilisent près de 1200 caractères (basiques et accentués, symboles, ponctuations, spéciaux etc.).  Imaginez le nombre de codepage nécessaires pour toutes ces langues. Si nous ajoutons  celles à alphabets étrangers l’on voit maintenant l’urgence d’affecter à chaque langue son codepage… 

 

Pour information: l’étendue de l’alphabet latin permet de couvrir tout le Continent Américain (Nord et Sud), les Pays Baltes, l’Europe Occidentale, Septentrionale, Centrale, Méridionale et de l’Est jusqu’en Asie avec l'aide de très nombreux codepages (plus de 50…).  Citons par exemple l’Azerbaïdjan, le Viêt-nam, certains Pays Balkaniques ou d’Asie Centrale...

 

Chaque pays qui le pouvait s’est empressé de créer son codepage et en informer les autres utilisateurs afin de se placer parmi les langues à écriture informatisée. Certains furent aidés d’autres acquirent la connaissance pour se doter d’un codepage et prendre place dans le rang. Ces pays eurent la volonté de rester au premier rang. Nous sommes dans un monde où l’adaptation de l’évolution technologique au mode de vie est devenue le principal stimulant de l’évolution vers la maîtrise de l’environnement.

 

Les pays qui ont suivi ce chemin sont maintenant armés pour profiter des facilités que procure cette informatisation de l’écriture. Ils ont choisi la construction d’un immeuble et non celle d’un pavillon en rez-de-chaussée.   La langue arménienne ne s’est pas donné cette chance !

 

La diaspora des USA, au lieu de créer un codepage arménien, s’est contentée «d’emprunter» un codepage US, le MS DOS CP_437, en remplaçant certains caractères de la seconde moitié de la table par des caractères arméniens. Cet emprunt permettra à la Diaspora, dotée d’un parc machine majoritairement MAC - le MAC se prêtait mieux à cet emprunt que le Windows de ces années - d’écrire et éditer des textes arméniens. Ce sera le premier codepage « adapté » pour l’écriture de l’arménien.

Nous avons pourtant ici l’image du pavillon construit sur les bases de la maison voisine.

 

Quelques années plus tard une action similaire démarre en Arménie soviétique. Mais Erevan, plutôt que de lancer la création d’un codepage arménien, fait comme aux USA en prenant cette fois le codepage 1251 cyrillic (codepage utilisé pour le russe). Encore un pavillon utilisant les fondations du voisin.

 

L’arménien se trouve désormais équipé de 2 codepages « empruntés » et incompatibles entre eux – Anglais US et  Cyrillique. 

 

Comment se fait la recherche du caractère que nous saisissons au clavier ? 

 

A la pression d’une touche du clavier son code – scancode - est envoyé, par le mini processeur intégré au clavier, vers le programme de conversion des signaux lequel compléte ce scancode avec le code caractère que le logiciel recherche dans le gestionnaire du clavier pour ensuite aller prendre dans la police le caractère à l’adresse spécifiée. 

En séjour dans un autre pays, lorsque l’on travaille avec un autre codepage que celui avec lequel le texte a été écrit, l’on aura donc changé aussi de gestionnaire de clavier. La fonction d’appel de code et d’affichage du caractère sera perturbée. Le mini processeur clavier ainsi que son gestionnaire ayant changé, ils ne chargeront plus le caractère attendu bien que le code de la case du codepage soit le même. Voilà pourquoi les tables sont incompatibles entre elles. Une liste en page 3 illustre clairement ce qui vient d’être dit.

 

Aujourd’hui l’évolution du système d’exploitation est arrivé à un point tel que travailler avec ces emprunts est devenu très difficile. Le traitement de texte est de plus en plus exigeant sur la définition de ce qu’est une langue. Cette exigence est en partie provoqué par les nouveaux outils ajoutés au traitement de texte; correction orthographique, contrôle grammatical, insertion de phrases préenregistrées, césure des mots etc. Il n’est plus possible d’écrire l’arménien et l'équiper des outils d'aide à l’écriture cités plus haut sans la présence d’un codepage arménien personnel car c’est la seule voie pour s’équiper au plus vite. Voilà une des premières raisons pour laquelle nous devons vite nous donner un codepage arménien.

 

La création d’un codepage arménien et de polices codifiées sous Unicode permettront la création des outils de rédaction énumérés au paragraphe précédant.  L'arménien se placera alors parmi les langues informatisées à usage universel, identique à celles qui en sont déjà pourvues.

 

Nota : Unicode codifie les caractères en 16 bits. Cela signifie que dans une police Unicode complète il y a jusqu’à 65536 caractères. Ils ne sont plus 256 comme auparavant. C’est pourquoi je propose avec Armenian Language des polices basiques qui englobent de nombreux codepages et permettent l’écriture multilingue partout dans le monde.

Je précise que c’est moi qui crée ou compose ces polices tout autant que les gestionnaires des claviers arméniens ou les créations ou modifications des fichiers qui sont cités.

 

Un nouveau codepage n’est pas difficile à réaliser (j’en ai un actuellement en essais). Ce qui difficile en est  l'intégration, à coté des autres codepages, dans un logiciel de création de Fontes afin que les polices arméniennes portent la table d’encodage Unicode propre à cette langue. 

La seconde difficulté est d’obtenir que les systèmes d’exploitation MAC ou WINDOWS intégrent également ce codepage arménien.  C’est à ces deux conditions que l’arménien deviendra une langue à part entière pouvant utiliser, dès le premièr jour de leur apparition ces divers outils car nous en sommes actuellement privés.

 

J’ espére que ces lignes attireront l’attention de l’Ambassade d’Arménie en France et l’Ambassade de France en Arménie afin que les démarches en plus haut lieu soient initiées.

 

Nous pourrons alors, dans quel pays que nous nous trouvions, avec l'aide des outils informatiques locaux, comme je le fais aujourd’hui lorsque je désire écrire en anglais ou en russe, lancer l’écriture d’un texte arménien, le formater et l’envoyer par e.mail tout aussi facilement que cela est possible aujourd’hui pour des textes Français, Anglais, Allemand, Russe etc. Il ne faudra que sélectionner la langue voulue et changer de clavier.

 

Post Introduction :

 

1 – Les dernières versions de Windows ont  rendu possible le travail, sur  le même ordinateur, en de nombreuses langues. Cela s’est amélioré avec les versions WIN 2000 et WIN XP.  Toutefois ce problème ne sera définitivement résolu qu'avec le renouvellement des logiciels actuellement en usage lorsque ces nouvelles éditions intégreront enfin le système Unicode et la codification 32 bits (problablement dans quelques années).

 

2 - L’on constate que l’arménien ne participe pas à cette évolution.  Les utilisateurs de l’arménien, pour l’écrire, n’ont pas les fichiers spécifiques à la langue, fournis avec WINDOWS. Les diasporas arméniennes ne seront pas éternelles. Les priver de correspondre entre elles ne fera qu'accélérer cette perte.     C'est ce que recherche l'Arménie ?

 

3 – Point important: Le codepage arménien doit obligatoirement être unique et utilisé par toutes les diasporas y compris l’Arménie. La richesse de ce projet est dans l'acte de donner à tous nos compatriotes, où qu'ils soient, la possibilité de travailler dans la langue du pays de résidence lorsque cela touche la vie locale puis de passer, sans contraintes, à l’arménien simplement par le basculement d’une langue vers l’autre.  Hélas  nous sommes placés, de fait aujourd’hui, en periphérie d'une société totalement informatisée.

 

Qu’apporte WINDOWS actuellement à la langue arménienne ?

 

Je ne parle pas du  système MAC actuel que je connais mal et qui est peu usité en France. Toutefois je pense que cette question est d’actualité autant pour le MAC que pour WINDOWS.

 

Des recherches approffndies sur Windows 2000 et Windows XP permettent de faire le constat suivant :

 

1 ) le fichier Locale.nls déclare la langue arménienne avec la référence langue 042b sans préciser de codepage.

2 ) le fichier Intl.inf  complète ces informations en affectant au clavier 042b :                           

*  le codepage OEMCP 437  (MSDOS anglais US),

                *  les groupes langages 17 et 5  ( 17 -  Arménien    5 - Cyrillique),

                *  les paires   langue/clavier   042b/0409     ( 0409 = Anglais US avec codepage MSDOS 437),

                        «                  «       «          042b/0419      ( 0419 = Cyrillique  avec  codepage  ANSI 1251).  

3 ) Le clavier arménien de l'Est     042b    (clavier 101 touches),

         "          "        "  "   de l'Ouest   1042b   (     "       "           "      ) qui n’est qu’une copie du 042b (ArmEst) .

4 ) dans le Registre le codepage ANSI  (pour l'arménien) est déclaré ACP  c_1251nls - (ANSI Cyrillique),

                                  le codepage MAC  (pour l'arménien) est déclaré  MACCP 10007  - (MAC Cyrillique).

 

L’on voit ici 2 codepages (437  MSDOS Latin 1 et ANSI 1251 Cyrillique) ne fonctionnant qu’avec un gestionnaire clavier 101 touches pour une utilisation locale : anglais US  042b/0409 ou cyrillic 042b/0419

Je ne vois pas dans ces critères une future évolution vers les outils qui permettraient à notre langue son universalisation par son passage à l'Unicode.

 

Réflexions : Pour qu’une langue accède à l’Unicode elle doit être conçue autour de son propre codepage qui portera les codes caractères de cette langue tels que définis par le standard Unicode.

-      A partir de cette base, celle des langues «normales», l’on pourra élaborer tous les outils énumérés de correction orthographique, de césure, de traduction de l’arménien vers ou à partir d’une langue étrangère ou un logiciel de reconnaissance de caractères permettant de scanner des textes arméniens et les rendre lisibles, modifiables et convertibles. Ces outils ne fonctionnent que si ils sont basés sur un codepage propre à cette langue car tous utilisent ce codepage comme référence de fonctionnement.

-      Pour l'arménien ceci est encore utopique car il n’a pas encore de codepage personnel.

-      Ci-dessous la liste montrant le changement du contenu de la même case lors du changement de codepage.

 

             Citons l'exemple d'une lettre placée à la case 205 d’un codepage ANSI:

 

-          Sous MSDOS 437 ( Anglais US)                               c’est le caractère code 2550

-          Sous ACP c_1251 ( Cyrillique)                                  c’est le caractère code 041D

-          Sous ACP c_1252 ( Europe Occidental)                   c’est le caractère code 00CD

-          Sous ACP c_1253 ( Grèce)                                            c’est le caractère code 039D

-          Sous ACP c_1255 ( Hébreu)                                        c’est le caractère code 05BD

-          Sous ACP c_1256 ( Arabe)                                           c’est le caractère code 062D

-          Sous ACP c_1257 ( Pays Baltes)                                 c’est le caractère code 0136

-          Sous ACP c_1351 (codepage Arménien)               c’est le caractère code 055D

 

l’Arménie s’éloigne de sa Diaspora .  Elle s'isole.  Elle ne pense qu’à Elle et pas au long terme.

Cela promet aux arméniens un avenir difficile avec des difficultés croissantes.

Ce comportement peut générer un important désaccord avec les diasporas actives qui voudront alors compenser cette absence et s'équiper pour leur besoin d'un "codepage diasporique universel". Un codepage unique et commun à tous les arméniens du globe nous permettra à tous de communiquer entre nous sur une base saine et universelle (Armenian Language est un exemple possible tant pour un codepage universel qu’un codepage diasporique). Cela évitera également la création de codepages « empruntés » réciproquement incompatibles.

Si rien n'est fait rapidement l’Arménie perdra la diaspora. Est-ce bien ce qu'Elle veut ?

Nous avons partout dans le monde, des compatriotes riches de moyens, d’une culture et d’un savoir qu’ils ne refuseront pas de partager avec tous les arméniens du monde. Pourquoi nier le besoin d’un lien - le codepage arménien - afin de  coordonner tout ceci librement, en pleine simplicité, sans appropriation partisane ? N'est-ce pas là que commence une relation désintéréssée et sincère ? Un pays n'est-il pas composé d'individus responsables, différents et complémentaires eutre eux? Pensez donc à la force qu’apporte chaque Diaspora riche des connaissances du pays de résidence et imaginez ce que cette force peut devenir losqu’elles sont réunies.

 

Nous attirons l’attention sur ce qui suit:

 

-      Windows ne propose pas de clavier 102 touches alors qu’une grande partie des utilisateurs dans le monde travaillent avec un clavier 102 touches.  Nous avons fait le tableau des claviers utilisés avec les codepages 1250, 1251, 1252, 1253, 1254, 1257, 950, 1291, 1292, 1293, 1294, 1295, 1296, 1298 et 1299. Ce tableau montre que sur 128 gestionnaires de clavier seuls 17 sont en 101 touches. Il faut ajouter que tous les utilisateurs d’un clavier 101 touches travaillent également avec un clavier 102 touches et son gestionnaire.

-      Il est clair que très bientôt le clavier 101 touches deviendra une antiquité comme  le sont les premiers claviers de 84 touches, oubliés de tous, alors qu’ils n’ont cessé d’exister que depuis peu. 

 

Il fallait corriger ces oublis. J’ai  tenté de le faire en concevant Armenian Language.

 

Armenian Language. Qu’est-ce que c’est ?

 

C’est un correctif novateur permettant de travailler en arménien, pour le moment, dans l’environnement Win2000 et Win XP.  Il est aussi précurseur de ce que sera la gestion des caractères arméniens à l’aide d’Unicode.

Actuellement la version WINDOWS 2000 est en essais. Les résultats sont encourageants. Si tout se passe bien la version WINDOWS XP sera rapidement créée et  soumise aux essais. 

Pour la version WINDOWS 98/Me un modèle de travail fait ses tests et sera bientôt disponible.

Pour le MAC j’espére le  bénévolat d’un expert en MAC pour être aidé à concevoir ce correctif.

 

Qu’apporte le Pack Armenian Language ?

 

a -  Des fichiers, modifiés ou nouveaux, basés sur le nouveau codepage universel arménien:

·                     Locale.nls modifié,

·                     c_1351.nls  -   Le codepage ANSI/OEM 1351 personnel à la langue arménienne, 

·                     CP_1351 –      Un codepage nécessaire pour les versions Windows antérieures,   

·                     c_10100.nls  - Le codepage MAC arménien propre à la langue arménienne.

b - Des gestionnaires de clavier et de nombreuses polices:

·                     3 gestionnaires de claviers; Armenian USA, Armenian Erevan et Armenian International.

·                     De nombreuses polices arméniennes TrueType ainsi que des polices basiques étendues telles Courier, Times, Arial  (Helvetica), Sylfaen intégrant les caractères de nombreux codepages et les caractères arméniens. Ces polices très complètes permettront d’écrire en de nombreuses langues et seront, dans une grande partie du monde, utiles à nos compatriotes pour des courriers plurilingues.

c -  Des accessoires et des manuels:

·                     Une planche de pastilles adhésives pour marquer les touches du clavier en utilisation.

·                     Un manuel d’installation.

·                     Des Instructions d’Utilisation et des Conseils et Astuces.

Les deux premiers claviers sont pareils à ceux en usage aux USA et à Erevan.  Le troisième est une version internationale, en 102 touches, très pratique pour tout le monde. (plans joints au Pack)

Ceux qui travaillent avec un clavier 101 touches pourront à peu de frais, sans grands changements d’habitudes de travail, passer au clavier QWERTY ou AZERTY 102 touches.

 

Le clavier 102 touches apporte une facilité que n’a pas le 101 touches car l’arménien a besoin de 48 touches sur chaque plan de clavier  -  38 lettres et 10 ponctuations ou 10 chiffres. Le clavier 102 touches dispose, par plan de clavier, des 48 touches nécessaires il est donc conforme au besoin.

 

Le clavier 101 touches n’a que 47 touches utiles par plan de clavier, c’est pourquoi :

* - Dans la version USA, le zéro (0) est placé avec les minuscules, les chiffres sont placés avec les majuscules.

* - Dans la version Erevan les chiffres sont expulsés du clavier et ne sont accessibles qu’au pavé numérique.

* - Pour certains utilisateurs européens, dont la France, les claviers arméniens actuels ne sont pas conformes car nous voyons une inversion de caractère (majuscule/minuscule inversée d’un caractère) et des ponctuations remplacées par des chiffres  - la cause en est aux codepages.  Ce sujet a déjà été évoqué.

 

Erevan a mis à la disposition de tous, gratuitement, un logiciel basé sur les codepages empruntés, permettant d’écrire et lire l'arménien mais son utilisation est restreinte, la lecture difficile et les mécontentements nombreux.  Une extension ANLS2.exe est aussi proposée pour pouvoir lire sur le WEB mais ce n’est qu’un complément au logiciel cité qui n’en modifie pas les carences.

 

La volonté d’aller vers une indépendance complète dans la langue et son écriture a très bien été comprise par certains pays anciennement communistes, et autres, qui se sont équipés, en plus du codepage 1251, d’un codepage avec alphabet latin et caractères accentués. C’est une démarche volontaire et réfléchie afin de sortir  le pays de cette limitation et entrer dans l’ère de l’informatique par la grande porte.

L’Arménie n’a pas saisie cette opportunité et ne propose rien de nouveau.

  

Conclusion :

 

Armenian Language installe une langue arménienne gérée par son propre codepage. Il deviendra possible d’écrire et envoyer un texte ou un graphique à une personne utilisant ce même et unique logiciel quel que soit son lieu de résidence et le codepage en utilisation chez elle; plus de barrière de clavier et d’alphabet locaux.

 

Lorsque les conditions expliquées plus haut sur la création du codepage et des outils spécifiques à l’arménien seront résolues l’on pourra sélectionner la langue arménienne dès le commencement d’un texte arménien, qui sera ainsi marqué comme langue de travail sur ce texte, puis utiliser les outils rattachés à cette langue (potentiels et futurs) permettant la correction orthographique, la césure, la recherche d’une traduction, d’un sens, d’un synonyme ou bien le scannage d'un texte par un logiciel de reconnaissance de caractères pour une traduction ou une insertion dans un traitement de texte sous forme de texte exploitable et modifiable… 

Je rappèle que tout cela ne sera possible qu’à la condition d’avoir un codepage arménien, des polices créées pour ce codepage et des outils d’aide à l’écriture conçus à partir de ce codepage. Il reste à le vouloir.

 

Faire un travail de cette importance n’est possible qu’en Groupe.

 

Je lance un appel aux bonnes volontés qui souhaitent participer bénévolement à  ces travaux et donner à la langue arménienne le rang et la place qu’elle mérite d’occuper.

 Il est indispensable de rester prêt à une action commune avec l’Arménie.  Cela exige auparavant un accord Ouest – Est  réciproque, une répartition des tâches et un planning d’avancement précis et sévère.

Si tout se termine bien, l’on pourra penser à d’autres actions vitales pour l’éveil et l’expansion de notre langue. Il y a tant de choses à faire alors que nous avons déjà le retard d'une révolution.

 

Je reste disponible à toute rencontre permettant de réfléchir et œuvrer sur l’avancement de ce programme et apporter, si besoin est, mon savoir et  mon expérience.

 

 Texte de Jean Edouard AYVASIAN                                                       Paris le 15/10/2003.     

         Revu et corrigé le 15/12/2003.