User:Diderot/arabalpha
en:Arabic alphabet
The 'Arabic Alphabet' is the writing system usually used to write the Arabic, Persian and Urdu languages. Although it is usually called an alphabet it is in fact an abjad - a writing system which marks exclusively, or at least generally, only the consonants of the language.
Because it was the writing system used in the canonical version of the Qur'an - the sacred text of Islam - it's influence and use expanded with the Muslim faith, and it came to be used for languages otherwise unrelated to Arabic, including Indo-European languages like Persian, Urdu and Kurdish, Altaic languages like Turkish and Uzbek, and some African languages like Haussa. Political changes and language reforms in the modern era have reduced the extent of the Arabic alphabet. During the 20th century, Turkish and the central Asian Turkic languages have ceased to use Arabic writing, replacing it with Latin and Cyrillic scripts. (More info in Adaptations de l'alphabet arabe)
This article does not discuss the pronunciation of Arabic letters, which vary from language to language and region to region within the Arabic speaking world.
Introduction
The Arabic alphabet has 29 basic letters (28 if we don't count the "hamza", whcih has many of the functions of a diacritic marker) and is written from right to left. There is no codified difference between cursive and block letter forms in this alphabet. It makes no upper and lower case distinctions. Even in print, the letters are generallty connected if they are together in a single word and their form varies according to ligature rules. Spaces are used to separate words and imply a break in the ligatures, however some letters do not form ligatures even when they are not at the end of a word.
Because the Arabic alphabet is an abjad, the reader must use their knowledge of the language to insert the correct vowels. This is much easier in Arabic than in non-semetic languages because the selection and placement of vowels into Arabic's consonantal root words is controlled by the grammar of the language. (Please see the article on Arabic language for more information.) However, in the Qur'an and in didactic works vowels are often marked through the use of Arabic diacritics. Such texts may also use diacritics to mark syllabisation - including most frequently the sukūn to indicate the absense of a vowel and šadda to indicate the doubling of a consonant.
History
The roots of the Arabic alphabet go back to Aramaic, particularly its Nabatean and Syriac variants, themselves, in turn, the decendants of the Phoenecian alphabet. Phoenetian is also the ancestor of the Hebrew, Greek and Latin alphabets, and through Greek the Cyrillic alphabet. The earliest attested use of the Arabic alphabet was in 512. During the seventh century, diacritics were added to some letters with varying sound values in order to make it easier to tell them apart. Early Arabic adopted its alphabet from Aramaic, which had fewer phonemes than Arabic. This process also changed the canonical order of the Arabic alphabet, whihc no longer follows the traditional order of semetic languages, known as the Levantine order, which modern Hebrew still follows.
Pour plus de détails, consulter l'article Histoire de l'alphabet arabe
Transliteration
L'alphabet arabe peut être translittéré et transcrit de diverses manières. On utilisera de préférence dans ce document la translittération DIN-31635. Il peut être codé par plusieurs jeux de caractères, parmi lesquels ISO-8859-6 et Unicode, grâce au bloc « Arabe », des emplacement U+0600 à U+06FF. Ces deux jeux, cependant, n'indiquent pas pour chaque caractère la forme contextuelle qu'il doit prendre. C'est au moteur de rendu de sélectionner le bon œil. Il existe cependant, dans le cas où l'on voudrait coder une forme particulière d'un caractère, les blocs « Formes de présentation arabe A » (U+FB50 à U+FDFF) et « Formes de présentation arabe B » (U+FE70 à U+FEFF), qui contiennent la majorité des caractères en variante contextuelle ainsi que les caractères étendus propres à d'autres langues. Il est aussi possible d'utiliser les liants sans et avec chasse. Enfin, le codage de l'arabe est logique, c'est-à-dire qu'on entre les caractères à la suite sans se soucier du sens de l'écriture (nécessairement inversé pour un Occidental). C'est encore une fois au moteur de rendu qu'il revient d'afficher les caractères dans le bon sens. À cet égard, si les mots arabes de cette page sont affichés à l'envers, c'est que votre moteur de rendu Unicode n'est pas assez récent. Pour plus de détails concernant les questions de codage de l'arabe, consultez la traduction française du manuel d'Unicode, disponible sur le site Hapax.
Conventions de transcription et d'écriture
La transcription et la translittération suivent principalement la norme DIN-31635 ; les variantes appartenant à d'autres normes sont indiquées après barre oblique (cf. Transcription des langues sémitiques). Noter que le macron suscrit au dessus des voyelles peut être aisément remplacé par un accent circonflexe. Une translittération de l'arabe doit faire apparaître clairement les caractères qui ne se prononcent pas ou se prononcent comme d'autres afin d'être non ambiguë ; une transcription n'indique cependant que la prononciation. Voir plus bas pour plus de détails. La transcription phonétique (ici quelque peu simplifiée) suit les conventions de l'API : pour plus de détails concernant la prononciation de l'arabe, consultez l'article Phonologie de l'arabe. Dans cet article, sauf mention contraire, l'arabe sera transcrit et non translittéré. Les termes notés en arabe sont entièrement vocalisés et tous les diacritiques sont indiqués (sauf certains suk?n). Dans la pratique, ce type de notation complète est très rare et ne se rencontre que dans les ouvrages didactiques, ce qui est le cas ici.
Lettres principales
Graphie isolée | Graphie initiale | Graphie médiane | Graphie finale | Nom | Trans. | Valeur |
---|---|---|---|---|---|---|
? | ?, ?, ?, ? |
hamza | ? / ’ et ‚ | [?] | ||
? | — | ? | ?alif | ? / â | [a?] | |
? | ? | ? | ? | b?? | b | [b] |
? | ? | ? | ? | t?? | t | [t] |
? | ? | ? | ? | ??? | ? / th | [?] |
? | ? | ? | ? | ??m | ? / j / dj | [?] |
? | ? | ? | ? | ??? | ? | [?] |
? | ? | ? | ? | ??? | ? / ? / kh | [x] |
? | — | ? | d?l | d | [d] | |
? | — | ? | ??l | ? / dh | [ð] | |
? | — | ? | r?? | r | [r] | |
? | — | ? | z?y | z | [z] | |
? | ? | ? | ? | s?n | s | [s] |
? | ? | ? | ? | š?n | š / sh | [?] |
? | ? | ? | ? | ??d | ? | [s?] |
? | ? | ? | ? | ??d | ? | [d?], [ð?] |
? | ? | ? | ? | ??? | ? | [t?] |
? | ? | ? | ? | ??? | ? | [z?], [ð?] |
? | ? | ? | ? | ?ayn | ? / ‘ | [??] |
? | ? | ? | ? | ?ayn | ? / gh | [?] |
? | ? | ? | ? | f?? | f | [f] |
? | ? | ? | ? | q?f | q / ? | [q] |
? | ? | ? | ? | k?f | k | [k] |
? | ? | ? | ? | l?m | l | [l] |
? | ? | ? | ? | m?m | m | [m] |
? | ? | ? | ? | n?n | n | [n] |
? | ? | ? | ? | h?? | h | [h] |
? | — | ? | w?w | w | [w] | |
? | ? | ? | ? | y?? | y | [j] |
Les lettres sans graphie initiale ni médiane ne sont jamais liées à la lettre suivante, même dans un mot. Quant à la ? hamza, elle n'a qu'une seule graphie, car elle n'est jamais liée ni à la lettre qui précède, ni à celle qui suit. La hamza peut aussi se comporter comme un diacritique (on dit alors qu'elle a un support). Aucun mot ne commence dans le dictionnaire par un ?alif : de fait, hamza est la première lettre, bien que, traditionnellement et historiquement, ce rôle échée à ?alif.
Autres lettres
Graphie isolée |
Graphie initiale |
Graphie médiane |
Graphie finale |
Nom | Trans. | Valeur |
---|---|---|---|---|---|---|
? | — | ? | t?? marb??a | h et t / Ø / h / ? | [t], [h], Ø | |
? | — | ? | ?alif maq??ra | ? / ? | [(a)?] | |
? | — | ? | l?m ?alif | l? | [l(a)?] |
T?? marb??a
Le ? t?? marb??a (« t?? bouclé » ; c'est, historiquement, un dérivé du ? t?? et non du ? h??, d'où la présence des deux points. Il suffit de boucler un t?? pour obtenir un t?? marb??a ) est une consonne, à savoir un /t/ ; toutefois, elle ne se trouve qu'en fin de mot et toujours précédée de /a/ (qui n'est que rarement écrit). Le son /t/ n'est prononcé que si les voyelles casuelles finales qui suivent la lettre le sont aussi ; or, ces voyelles sont souvent omises dans la prononciation courante. C'est pour cette raison qu'on indique, improprement, que cette lettre vaut [a(t)].
Dans une prononciation soutenue, on fait entendre à la pause un [h] à la place du [t]. Le t?? marb??a est rarement transcrit quand il est muet ; seule la translittération en indique généralement la présence (voir plus bas à la section « Translittération »), mais les usages sont très fluctuants. Dans cette encyclopédie, le t?? marb??a sera noté par ?. Voir aussi plus bas à « Types de lecture » pour d'autres détails.
?Alif maq??ra
La lettre ? ?alif maq??ra ne s'utilise qu'en fin de mot ; c'est une lettre de prolongement pour le phonème /a/. Son nom indique le son obtenu, « ?alif de prolongement », et non sa forme, puisque la lettre ressemble à un ? y??. Son utilisation est décrite à la section « Voyelles longues et lettres de prolongement ».
Ligature l?m ?alif
Lorsqu'un ? l?m est suivi d'un ? ?alif, il faut remplacer les deux lettres par la ligature ?? ; il existait auparavant d'autres ligatures de ce type, qui ne sont cependant plus utilisées, sauf dans des compositions soignées et quelques cas figés. On peut encore les rencontrer dans des textes anciens. Certaines sont représentées dans l'article consacré aux ligatures.
?Alif muet
Dans quelques mots, et surtout au cours de la flexion verbale, on peut écrire un ?alif qui ne se prononce pas et ne sert pas de support à un diacritique. On le trouve principalement dans le mot ?????? mi?a, « cent » (qui serait écrit plus régulièrement ?????). Dans la conjugaison, on ajoute un ?alif muet après un w?w ? en fin de mot ; ainsi :
- ???????? katab?, « ils ont écrit » ;
- ??????? ramaw, « ils ont lancé ».
Diacritiques
Tel qu'écrit couramment, l'alphabet arabe n'utilise pour ainsi dire pas de diacritiques, outre le point souscrit ou suscrit obligatoire pour disinguer des lettres ambiguës (consulter Histoire de l'alphabet arabe pour plus de détails). Pour faciliter la lecture, cependant, et ce dans un cadre didactique ou religieux, de nombreux signes auxiliaires viennent rendre le texte moins ambigu : l'arabe ne notant normalement pas les voyelles, par exemple, ni les géminations ou encore les assimilations, il n'est pas possible à un lecteur débutant de lire à voix haute un texte sans l'aide de ces signes, ou sans une bonne connaissance de la langue.
Les diacritiques utilisés sont décrits en détail dans l'article Diacritiques de l'alphabet arabe, qu'il est conseillé de lire avant de poursuivre plus avant la lecture de cet article. Les mots arabes cités ici, en effet, utilisent ces diacritiques et leur connaissance est nécessaire à la compréhension de certains points.
Notation des voyelles
Toutes les lettres des tableaux précédents sont des consonnes (ou des lettres muettes), contrairement à ce qu'on pourrait croire. Les voyelles ne sont que rarement notées, et si elles le sont, c'est sous la forme de diacritiques.
Voyelles brèves
Celles-ci ne sont pas indiquées autrement que par des diacritiques, et ce seulement pour lever des ambiguïtés (rarement) ou dans les ouvrages didactiques ou religieux.
Voyelles longues et lettres de prolongement
Quatre lettres, dites « de prolongement », sont employées pour indiquer la présence d'une voyelle longue — qui, elle, n'est normalement pas écrite —, ? ?alif, ? ?alif maq??ra (seulement en fin de mot), ? y??, et ? w?w. Ces deux dernières sont aussi les consonnes pleines y et w. Dans un texte non vocalisé, ce qui est de loin le cas le plus fréquent, l'on obtient les ambivalences suivantes :
- ? ?alif = ? ou d'autres phonèmes, parmi lesquels la consonne ? ;
- ?alif maq??ra = ? en fin de mot ;
- ? y?? = ? ou y ;
- ? w?w = ? ou w.
En fait, l'arabe, par exemple pour le son ?, décompose logiquement le phonème long en uw ; comme seule la consonne est écrite, celle-ci semble noter aussi ?. De sorte, ces lettres, qui sont toutes des consonnes (historiquement pour ? ?alif), peuvent, d'une certaine manière, remplir le rôle de voyelles longues ; on dit alors qu'elles sont des matres lectionis (en latin « mère de la lecture »). En effet, l'alphabet arabe, bien qu'il soit un abjad, marque systématiquement l'emplacement de voyelles longues : partant, ces signes indiquant les emplacements en question sont aussi lus comme des voyelles. D'autres écritures sémitiques, du reste, comme l'alphabet hébreu, retiennent ce procédé, ce qui mène certains spécialistes des écritures (comme Thomas Bauer ; cf. bibliographie ci-dessous) à considérer que ces abjads ne sont pas purement consonantiques et qu'ils méritent bien l'appellation d'alphabets dotés de voyelles.
Diphtongues
Deux diphtongues sont principalement utilisées, ay et aw ; comme a n'est normalement pas écrit, seul le deuxième élément, y ou w l'est, au moyen de la consonne idoine, ? y?? ou ? w?w, ce qui crée une nouvelle ambiguïté ; en effet, ? y?? et ? w?w peuvent donc être lus comme :
- des consonnes ;
- des lettres de prolongement ;
- des seconds éléments de diphtongue.
Écriture de la hamza
Historiquement, la lettre ?alif notait une occlusive glottale, ou « coup de glotte », transcrite par [?], ce que confirment les alphabets issus de la même origine phénicienne. Or, il a servi, de la même manière que dans d'autres abjads, avec y?? et w?w, de mater lectionis, c'est-à-dire de caractère de remplacement pour noter une voyelle longue (voir plus bas). De fait, au cours du temps sa valeur phonétique s'est effacée et, depuis, ?alif sert principalement à remplacer des phonèmes, noter l'allongement de la voyelle /a/ ou servir de support graphique à certains signes.
L'alphabet arabe se sert maintenant de la lettre hamza pour transcrire le coup de glotte, phonème qui, en arabe, peut se manifester n'importe où dans un mot, même à l'initiale ou en finale. Cette lettre, cependant, ne fonctionne pas comme les autres : elle peut être écrite seule ou avoir besoin d'un support, auquel cas elle devient un diacritique :
- sans support : ? ;
- avec support : ? ,? (sur et sous un ?alif), ? (sur un w?w), ? (sur un y?? sans points ou y?? hamza).
Le détail de l'écriture de la hamza est trop complexe pour être traité ici ; un article séparé lui est consacré : Alphabet arabe (écriture de la hamza).
Assimilations
L'alphabet arabe ne note pas les cas d'assimilations des consonnes en contact :
- dévoisement : malgré ce que la graphie indique, ????????? mubtada? est prononcé /muptada?/. Il est notable que l'écriture ne se modifie pas dans ce cas pour suivre la prononciation, au contraire de ce qu'elle fait dans d'autres cas (élision de la hamza instable, par exemple) ;
- assimilation complète de l'article ??? ?al : le /l/ de l'article est entièrement assimilé aux consonnes dentales qui suivent (traditionnellement nommées consonnes « solaires » par opposition aux autres, dites « lunaires ») ; l'écriture, cependant, ne note pas clairement cette assimilation : /?al/+/d/ > /?add/, noté ? + ??? (?al + d-) > ????? (translittération : ?aldd- ; noter la šadda) et non *???? (translittération : ?add). La lettre l?m, en effet, continue d'être écrite bien qu'elle ne soit plus prononcée (elle ne reçoit donc pas de suk?n) ; la graphie est d'autant plus redondante que la gémination obtenue peut être — rarement — indiquée par la šadda. La transcription doit cependant donner la prononciation, dans le cas précédent : ?ad-d (on place un trait d'union entre l'article et le nom pour indiquer que dans la graphie arabe, l'article est directement collé au nom ; c'est aussi le cas pour d'autres mots outils).
Graphie | Translittération | Transcription |
---|---|---|
? ,? ,? ,? ,? ,? + ??? |
?al + t-, ?-, d-, ?-, r-, z- | ?al + t-, ?-, d-, ?-, r-, z- |
= | = | = |
????? ,????? ,????? ,????? ,????? ,????? |
?altt-, ?al??-, ?aldd-, ?al??-, ?alrr-, ?alzz- | ?at-t-, ?a?-?-, ?ad-d-, ?a?-?-, ?ar-r-, ?az-z- |
? ,? ,? ,? + ??? | ?al + s-, š-, ?-, ?- | ?al + s-, š-, ?-, ?- |
= | = | = |
????? ,????? ,????? ,????? | ?alss-, ?alšš-, ?al??-, ?al??- | ?as-s-, ?aš-š-, ?a?-?-, ?a?-?- |
? ,? ,? ,? + ??? | ?al + ?-, ?-, l-, n- | ?al + ?-, ?-, l-, n- |
= | = | = |
????? ,????? ,????? ,????? | ?al??-, ?al??-, ?alll-, ?alnn- | ?a?-?-, ?a?-?-, ?al-l-, ?an-n- |
Lettres utilisées pour d'autres langues
En arabe même, dans l'alphabet dit « occidental », la lettre f?? était écrite ? (au lieu de ? de l'alphabet oriental), tandis que q?f était représentée par ? (plutôt que ?). De nos jours, les éditions maghrébines suivent les usages orientaux.
Pour les langues autres que l'arabe, consulter Adaptations de l'alphabet arabe.
Ponctuation
L'arabe s'écrivant de droite à gauche, les éditions modernes utilisent des signes de ponctuation respectant cette écriture, à savoir :
- la virgule renversée « ? » (qui permet aussi de ne pas être confondre «, » avec « ? », par exemple) ;
- le deux-points renversé « ? » ;
- le point d'interrogation inversé « ? ».
Numération
Consulter l'article Numération arabe.
Autres problèmes d'orthographe
[À compléter]
- Rencontres de suk?n, sukun et hamza instable ;
- paragoge dans les mots étrangers.
Styles d'écritures
[À compléter]
Types de lecture
[À compléter]
À propos de la translittération
On l'a vu, certaines lettres ont plusieurs fonctions, d'autres sont muettes : la transcription est donc souvent ambiguë :
- la hamza indépendante, ainsi que ?alif, y?? et w?w quand ils portent la hamza diacritée, ont tous la valeur [?], transcrite ? ;
- ?alif et ?alif maq??ra servent tous deux à allonger le /a/ : la transcription ne permet pas de savoir laquelle des deux lettres est utilisée ;
- le t?? marb??a est rarement prononcé /t/ ; la transcription ne le note donc généralement pas ;
- les tanw?n ne peuvent être différenciées d'une suite {voyelle + n} ;
- le suk?n et la šadda n'apparaissent pas dans une transcription ; de même, le /l/ de l'article assimilé devant consonne « solaire » n'est pas noté, etc.
Toutes ces raisons font qu'il est parfois utile d'utiliser une translittération précise qui suive l'original arabe, caractère par caractère. La norme ISO 233 permet cela (dans les exemples suivants, on placera les translittérations entre accolades) :
- chaque consonne est écrite avec un symbole consonantique, même le ?alif (translittéré {’}, apostrophe courbe), le w?w, et autres lettres d'allongement :
- les voyelles ne sont indiquées que si le texte de départ est vocalisé ;
- les différents types de hamza sont notés par :
- {'} (apostrophe droite) avec un support : ????????? ?aq??ib {?aqa’y'ib°},
- {?} sans support : ????? ?aw? {?aw°?},
- ?alif maq?ura est noté {?} : ????? mat? {mata?} ;
- t?? marb??a vaut {?} (dans d'autres normes, un {?}) : ??????? sab?a {sab°?a?} ;
- les tanw?n sont rendues par un accent aigu : ??????? ra?ulan {ra?ulá?} ;
- le suk?n est noté par un {°} : ????? zaw? {zaw°?}, la šadda par un macron : ?????? šadda {šada?} ;
- l'assimilation de l'article est écrite lettre par lettre : ????????? ?aš-šams {'a’lšam°s}, etc.
Bibliographie
- Michel Neyreneuf et Ghalib Al-Hakkak, Grammaire active de l'arabe, Le Livre de Poche, collection « Les langues modernes », 1996 ;
- Régis Blachère et Maurice Gaudefroy-Demombynes, Grammaire de l'arabe classique, cinquième édition, Maisonneuve et Larose, 2004 ;
- The World's Writing Systems, ouvrage collectif sous la direction de Peter T. Daniels et William Bright, article « Arabic Writing » de Thomas Bauer, Oxford University Press, 1996 ;
- Dictionnaire Mounged de poche (français arabe ? ?????? ?????), dixième édition, éditions Dar el-Machreq, Beyrouth.
Divers
- code ISO 15924 : Arab