Comment assurer la présence d une langue dans le cyberespace?

of 20
98 views
PDF
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Document Description
Comment assurer la présence d une langue dans le cyberespace? Par Marcel Diki-Kidiri Chargé de recherche au CNRS, Laboratoire «Langage, Langues et Cultures d Afrique Noire» (LLACAN) PIPT Programme Information
Document Share
Document Transcript
Comment assurer la présence d une langue dans le cyberespace? Par Marcel Diki-Kidiri Chargé de recherche au CNRS, Laboratoire «Langage, Langues et Cultures d Afrique Noire» (LLACAN) PIPT Programme Information pour tous Les idées, les éléments d information et les opinions exprimés dans cette publication sont ceux des auteurs. Ils ne refl ètent pas nécessairement les vues de l UNESCO et n engagent pas l Organisation. Note bibliographique recommandée : UNESCO. Programme Information pour tous (PIPT). Comment assurer la présence d une langue dans le cyberespace? Edité par la Division de la société de l information, Secteur de la communication et de l information (Editeur : Claudio Menezes) Paris, UNESCO, 2007 : 80 p. ; 21 cm. (CI-2007/WS/1) I Titre II UNESCO III Programme Information pour tous Publié en 2007 Par l Organisation des Nations Unies pour l éducation, la science et la culture. 7, place de Fontenoy F Paris 07 SP, Paris, France Internet : Coordinateur de la publication : Boyan Radoykov Composé et imprimé dans les ateliers de l UNESCO UNESCO 2007 Printed in France Tous droits réservés (CI-2007/WS/1 CLD 31084) Avant-propos Les langues sont avant tout des instruments permettant d acquérir une autonomie éducative et culturelle. Elles permettent la transmission de connaissances entre générations, en étant un vecteur pour la dissémination des cultures et traditions entre et parmi les différents groupes ethniques dans des zones géographiques diverses. Le phénomène du développement et la disparition des langues fait partie de l évolution et du déclin des civilisations. Le latin une langue morte joue encore aujourd hui une infl uence majeure sur les langues vivantes, y compris étant la base initiale pour le premier code standard pour les ordinateurs, le code ASCII. La langue maternelle est également le premier véhicule pour la liberté d expression. La disparition de quelques langues est un phénomène présent dans le cours de l Histoire. Même dans des pays offi ciellement déclarés comme monolingues, des nouvelles politiques sont en train d émerger pour assurer l expression dans les langues endogènes comme un droit humain. D après une étude développée par «Ethnologue», l indice de diversité linguistique par région montre que l Afrique est le continent avec l indicateur le plus élevé dans le monde. Il y a des évidences indiquant que la diversité linguistique globale est à présent en déclin depuis longtemps. Un autre élément d inquiétude : d après quelques estimations, la moitié des langues aura disparu vers l année Les technologies de l information et de la communication jouent un rôle clé dans les transformations linguistiques ayant lieu dans le monde : elles peuvent être un important véhicule de communication entre les différentes communautés linguistiques. Par contre, les TICs peuvent être un facteur aggravant de la marginalisation des langues dans le cyberespace. Il y a approximativement langues dans le monde, dont 12 langues correspondent à 98 % des pages web sur l Internet. L anglais, avec 72 % des pages web, est l idiome dominant, d après une expérience menée par O Neill, Lavoie et Bennet en Après tout, le défi devant la communauté internationale est de franchir les obstacles gigantesques pour assurer la création d un cyberespace multilingue et culturellement diverse. Pour ce faire, l UNESCO avec l aide de l Union latine et la contribution intellectuelle de l expert Marcel Diki-Kidiri publie le présent document technique, dans le cadre de la série de publications du «Programme Information pour tous». Cohérente avec la «Recommandation sur la promotion et l usage du multilinguisme et l accès universel au cyberspace», adoptée par la Conférence générale de l UNESCO lors de sa 32 e session, la présente publication contribuera à faciliter la prise de décision en faveur de l inclusion de nouvelles langues dans l espace numérique. Abdul Waheed Khan Sous-Directeur général pour la communication et l information Sommaire Introduction 7 1. Élaboration de ressources linguistiques De l oral à l écrit Développement terminologique Élaboration des ressources informatiques Systèmes d écriture et orthographes Jeux et polices de caractères Codage des caractères Premières ressources de base Localisation des logiciels Élaboration des contenus culturels Contenus culturels Préparer les voies d accès au cyberespace Développer la communauté des utilisateurs Création d une communauté d utilisateurs Aspects politiques et socioculturels Conclusion 49 Références 51 Annexe 1 : Jeux de caractères AFRFUL 53 Annexe 2 : Jeux de caractères AFRLIN 67 Introduction Le cyberespace est ouvert à toutes les langues du monde car son infrastructure n est pas soumise à l autorité d un pouvoir central qui déciderait de son utilisation. Il suffi t, en principe, de disposer d un ordinateur relié à un fournisseur d accès Internet pour affi cher sur la Toile des données textuelles, iconographiques ou sonores dans la langue de son choix. La mise en oeuvre de ce principe qui est un facteur fondamental de la démocratie au niveau mondial, nécessite, cependant, que soient réunies un certain nombre de conditions techniques et de ressources humaines et fi nancières que nous allons examiner dans la présente étude. En rédigeant celle-ci, nous avons voulu répondre aussi simplement que possible à la question suivante : comment faire en sorte qu une langue peu dotée en ressources linguistiques et/ou informatiques, voire en ressources humaines, puisse arriver à trouver une place dans le cyberespace et y être active? Par extension, toute langue ayant plus ou moins de ressources peut trouver des réponses dans cette étude si elle est faiblement représentée dans le cyberespace. Nous décrivons ici le parcours le plus long, celui d une langue n ayant même pas de représentation écrite, mais d autres langues mieux loties trouveront les étapes qui les concernent sur le même chemin. Il nous faut d emblée répondre à une question préalable. Qu estce qu une langue peu dotée? Il s agit d une langue qui ne dispose pas suffi samment, voire pas du tout, des ressources essentielles dont sont généralement dotées les grandes langues du monde, à savoir : une orthographe stable dans un système d écriture donné, des ouvrages de référence (grammaires, dictionnaires, ouvrages littéraires), des oeuvres de diffusion massive (presse écrite et audiovisuelle, fi lms, chansons et musique), des ouvrages techniques et d apprentissage (publications techniques et scientifi ques, ouvrages didactiques, manuels), divers supports de communication du quotidien (affi ches, publicités, courriers, notices, modes d emploi, etc.), ainsi qu un nombre abondant d applications informatiques dans cette langue. Sur le plan des ressources humaines, une langue peu dotée peut devenir une langue en danger de disparition si elle n est plus parlée que par un petit nombre de locuteurs. Il devient alors nécessaire pour la sauver, d augmenter le nombre de ses locuteurs en l enseignant par tous les moyens techniques possibles. Heureusement, une langue peu dotée n a pas nécessairement tous ces handicaps à la fois. Elle peut être majoritaire, écrite, enseignée à l école et pourtant manquer cruellement de ressources informatiques ou même de ressources linguistiques en quantité et en qualité suffi santes. Il est donc plus juste de dire que les langues peu dotées le sont de manière très variée depuis les langues en grand danger de disparition, jusqu aux langues émergeantes qui possèdent déjà une bonne partie de ces ressources, mais en nombre estimé insuffi sant et incomplet. De nombreuses langues sur tous les continents répondent à cette défi nition des langues peu dotées. On peut citer en Europe le breton, l occitan ou encore le basque, en Amérique, la quasi-totalité des langues amérindiennes, en Asie, le myanmar 1, pour n en citer qu une parmi des centaines, en Océanie, la quasitotalité des langues autochtones des îles polynésiennes, micronésiennes et mélanésiennes. En Afrique, où se parlent un tiers des langues du monde, soit environ 2000 langues, les langues les mieux dotées (afrikaans, kiswahili, hausa, etc.) se comptent sur les doigts d une main et font partie des langues émergeantes, donc des langues peu dotées. Nous partirons donc de l hypothèse la plus défavorable, à savoir, une langue qui fut jadis porteuse d une culture fl orissante, mais qui n est plus parlée aujourd hui que par une poignée de personnes âgées dans un petit village au fi n fond de la brousse africaine, disons en Afrique centrale pour être aussi loin que possible de toutes les côtes. Appelons cette langue le ndeka. Une telle langue n a pratiquement aucune chance d accéder un jour au cyberespace, car elle risque de disparaître à tout jamais à la mort de son dernier locuteur, et ils ne sont plus très nombreux à la parler. Voici qu un jour un jeune étudiant issu de ce village trouve que des outils comme SPIP, Wikipedia et bien d autres encore pourraient offrir une formidable opportunité 1 Nouvelle dénomination de la langue appelée birmane autrefois. 8 de conserver la mémoire de cette langue et de ce fait celle de son village et de la culture de ses ancêtres. Ce serait même le moyen le plus sûr de faire apprendre cette langue aux jeunes de sa génération et ainsi lui redonner une nouvelle vie. Il vient nous trouver pour nous demander de le guider dans son projet. Avec cette hypothèse en tête, notre exposé se veut didactique, afi n d accompagner, pas à pas, tous ceux qui nous rejoindront à n importe quelle étape du chemin pour porter jusque dans le cyberespace toutes les langues peu dotées, quelle que soit leur fortune. 9 1. Élaboration de ressources linguistiques 1.1. De l oral à l écrit L objectif de cette première étape est de doter la langue d un minimum de ressources linguistiques, à savoir : une orthographe dans un système d écriture, une grammaire écrite, un dictionnaire et un recueil de textes aussi fourni que possible. C est donc un travail de linguiste que nous allons évoquer dans les grandes lignes, tout en nous concentrant sur les objectifs intermédiaires les plus indispensables Recueil de textes La première chose à faire est d aller trouver les locuteurs de la langue et d enregistrer autant de textes que possibles, des récits de vie, des contes, des proverbes, des chansons, des poèmes, des légendes, des conversations, des narrations, etc. Pour faire ces enregistrements, il vaut mieux apprendre des techniques de recherche sur le terrain et utiliser autant que possible des appareils de qualité professionnelle, afi n d obtenir la meilleure qualité sonore possible, car le son ainsi enregistré sera par la suite soumis à de nombreux traitements. Il serait dommage que la qualité du son se dégrade dès la deuxième copie! Dans des conditions de travail normales, les enregistrements sont immédiatement traduits avec l assistance des locuteurs de la langue et transférés dans une base de données textuelles Transcription phonétique En utilisant l alphabet phonétique international (API) les linguistes peuvent transcrire très exactement n importe quel son de n importe quelle langue du monde. Les textes recueillis peuvent donc être ainsi transcrits. Mais il faut bien comprendre que la transcription phonétique reproduit très fi dèlement chaque son tel qu il est pro- noncé en un moment donné. Or, en français, dans un mot comme papa le premier P est légèrement plus explosif que le second parce qu il est en début de mot et l autre entre deux voyelles. Cette différence est habituellement négligée car elle n entraîne aucune conséquence pour le sens du mot, mais une bonne transcription phonétique la refl ètera comme ceci [p apa] 2. La transcription phonétique est indispensable pour permettre une bonne analyse des sons de la langue, mais elle n est pas du tout la meilleure façon de l écrire pour un usage courant Analyse et notation des phonèmes Si la transcription phonétique est faite correctement, c est-à-dire avec minutie et fi délité par rapport aux sons réellement prononcés, il sera alors aisé de procéder à une analyse phonologique, dont l objectif est d identifi er les sons utiles de la langue qu on appelle les phonèmes. Il s agit de sons qui entraînent une différence de sens quand ils changent. Par exemple, en français, on dira que /p/ 3 et /b/ sont deux phonèmes différents parce que leur différence de prononciation permet à elle seule de distinguer les mots «pain» et «bain». Par contre, certaines personnes prononcent le mot roi avec un R roulé et d autres avec un R grasseyé. Ces deux R sont phonétiquement différents et transcrits respectivement [r] et [R]. Pourtant cette différence phonétique n entraînant aucune différence de sens, ces deux sons ne représentent qu un seul phonème que l on conviendra de noter /r/. Un autre exemple, la suite de sons [gz] que l on trouve dans le mot «exact» prononcé [egza] et la suite de sons [ks] du mot «extra» prononcé [ekstra] représentent toutes deux le même phonème que l on conviendra de noter /x/. Ainsi, l analyse phonologique d une langue aboutit à établir la liste complète des phonèmes de cette langue et la manière de les noter. On peut alors utiliser cette liste de phonèmes pour écrire un texte. On parle alors d une notation phonologique par opposition à la trans- 2 On utilise les crochets carrés pour indiquer que le mot est transcrit phonétiquement. 3 On utilise les barres obliques pour indiquer un phonème ou une suite de phonèmes. 12 cription phonétique. Dans une notation phonologique, ce sont les phonèmes, et non plus les sons, qui sont représentés. La notation est donc bien plus économique et fournit une bonne base pour l élaboration d une orthographe Analyse et notation des tons On peut prononcer une syllabe sur une hauteur de voix (ou registre) relativement grave, moyenne ou aiguë comme les notes de musiques do ré mi. La majorité des langues africaines exploitent cette variation de hauteur de voix pour exprimer des différences de sens avec une même combinaison de phonèmes. Ainsi, en sängö 4, les mots [ká] (là-bas), [ka _ ] (plaie), et [kà] (et) sont trois mots très différents et il ne s agit en aucun cas d homonymes. On qualifi e ces langues de langues à tons. Une langue à tons peut exploiter jusqu à cinq registres différents, mais la plupart des langues africaines n en exploitent que deux ou trois avec deux registres, on distingue un ton haut et un ton bas. Avec trois registres, on distingue un ton bas, un ton moyen et un ton haut. Au-delà on distingue, en plus, un ton supra-haut et/ou un ton infra-bas. C est à l issue d une analyse tonologique que l on détermine si une langue est à tons ou non et, dans l affi rmative, le nombre de registres utilisés, la fréquence des tons, la meilleure façon de les noter, etc. Dans une langue à tons, un mot est nécessairement composé d au moins une voyelle et un ton. Ainsi, une forme comme ka, évoquée plus haut, ne revêt de sens que lorsqu on précise le ton sur lequel le mot doit être prononcé. Il faudrait donc logiquement envisager de noter les tons dans le système orthographique de la langue. Toutefois, toutes les langues tonales ne font pas un usage identique des tons. Certaines se servent des tons non seulement pour distinguer des mots au niveau du lexique, mais également des formes verbales et des modalités personnelles et aspectuelles, donc des 4 Le sängö est la langue nationale de la République centrafricaine et partage le statut de langue offi cielle avec le français. 13 valeurs grammaticales. Dans de telles langues les tons occupent une place bien trop importante pour être négligés. Par contre, dans les langues qui ne recourent aux tons qu au niveau du lexique et de façon relativement limitée (par exemple, pour ne distinguer que des mots brefs où l ambiguïté peut être plus élevée), on a souvent pris le parti de ne pas noter les tons dans l orthographe courante. Il est donc nécessaire de prendre une décision au cas par cas. Toutefois, il faut souligner que pour les travaux de recherche linguistique sur une langue à tons, la notation des tons est absolument indispensable, car dans ce genre de travaux, on doit prendre en compte toutes les informations sur la réalité de la langue, et les tons constituent une dimension importante et défi nitoire d une langue à tons Élaboration d une orthographe Les études phonologiques et tonologiques aboutissent à un système de notation de la langue qui représente correctement les sons utiles, et ce, de façon aussi économique que possible. Il permet à 90 % d écrire ce qu on prononce, sans raffi nement phonétique, et cela suffi t pour que l on soit tenté de se contenter de la notation phonologique et de faire l économie d études orthographiques. Cependant, celles-ci s avèrent réellement indispensables pour doter une langue d un système conventionnel capable de prendre en compte l ensemble des besoins d expression écrite des locuteurs. En effet, à la différence de la notation phonologique qui ne refl ète que les sons utiles de la langue, une orthographe bien conçue intègre aussi la notation des relations grammaticales et des idées. Considérons, en français, les exemples suivants : a) / l ãt/ b) elle chante c) elles chantent La phrase a) présente la notation phonologique qui correspond aussi bien à la phrase b) qu à la phrase c). Si le français était écrit uniquement avec une notation phonologique, il n y aurait aucun moyen de distinguer ici le singulier du pluriel comme le permet la convention orthographique. 14 Prenons un autre exemple en sängö, une langue qui distingue un ton haut, un ton moyen et un ton bas. En notation phonologique, ces tons sont notés respectivement par un accent aigu [á], un accent plat [ā] et un accent grave [à], mais ces accents ne se trouvent pas sur les machines courantes en Centrafrique. Une orthographe est pourtant destinée à un large public, et l on doit pouvoir écrire la langue aussi bien à la main qu à la machine ou à l ordinateur. C est pourquoi il faut élaborer une convention orthographique comportant un ensemble de règles qui permettent d écrire la langue de façon plus pratique. Le tableau suivant montre les différentes étapes nécessaires à l élaboration d une orthographe optimale et stable pour une langue, en l occurrence, le sängö : Transcription phonétique Notation phonologique Orthographe 1 (47 % ) Orthographe 2 (53 %) 1. [sùkúlà] /sùkúlà Sukûla sukûla laver Traduction 2. [sā g - ] /sāngō Sängö sahngo sango (langue) 3. [ m básá m bálá] /mbásámbáláa Mbâsâmbâlâ mbâssambala sept 4. [māī g - ] /māīngō Mäïngö mayhngo évolution 5. [k w à] ~ [k ù à] /kùà kua kua travail 6. [k w ā] ~ [k ū ā] /kūā küä kwa poil 7. [k w á] ~ [k ú á] /kúá kûâ kwâ mort On remarque que la transcription phonétique refl ète la prononciation des mots telle qu ils sont enregistrés au magnétophone. Elle est donc propre à la recherche linguistique, mais trop fi ne pour servir de base à une orthographe courante destinée au grand public. La notation phonologique de la deuxième colonne ne retient que les sons utiles, les phonèmes, et de ce fait, elle est plus propice à servir de base à une orthographe courante. Mais le marquage de tous les tons constitue un obstacle pour une écriture pratique et une lecture rapide. En outre, les diacritiques symboles utilisés pour marquer les tons (accent aigu, accent plat et accent grave) ne sont pas disponibles sur toutes les machines et ne peuvent être rendus correctement qu avec un ordinateur, ce
Similar documents
View more...
Search Related
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks
SAVE OUR EARTH

We need your sign to support Project to invent "SMART AND CONTROLLABLE REFLECTIVE BALLOONS" to cover the Sun and Save Our Earth.

More details...

Sign Now!

We are very appreciated for your Prompt Action!

x