アラビア文字補助
アラビア文字補助 | |
---|---|
Arabic Supplement | |
範囲 |
U+0750..U+077F (48 個の符号位置) |
面 | 基本多言語面 |
用字 | アラビア文字 |
主な言語・文字体系 | |
割当済 | 48 個の符号位置 |
未使用 | 0 個の保留 |
Unicodeのバージョン履歴 | |
4.1 | 30 (+30) |
5.1 | 48 (+18) |
公式ページ | |
コード表 ∣ ウェブページ |
アラビア文字補助(アラビアもじほじょ、英語: Arabic Supplement)は、Unicodeの15個目のブロック。
解説
[編集]アラビア語モロッコ方言(ダリジャ)、ジャウィ文字(かつてのマレー語、及び現在タイなどで話されているジャウィ語を表記するための文字)、サライキ語、ブルシャスキー語、カラム語などのいくつかの言語を表記するためのアラビア文字のうち、アラビア文字ブロックに収録されていないものの一部が収録されている。
通常のアラビア文字と同様に子音のみを記述するアブジャドであり、右から左へと横書き(右横書き)され、文字が書かれる単語内の位置によって独立形・語頭形・語中形・語末形の4種類の形状を取る。
本ブロックはUnicodeのバージョン4.1で初めて追加された。
収録文字
[編集]コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
拡張アラビア文字 | ||||
U+0750 | ݐ | ARABIC LETTER BEH WITH THREE DOTS HORIZONTALLY BELOW | フラニ語東部方言(フルフルディ語)[1][2] | |
U+0751 | ݑ | ARABIC LETTER BEH WITH DOT BELOW AND THREE DOTS ABOVE | フラニ語西部方言(プラー語)[1][2] | |
U+0752 | ݒ | ARABIC LETTER BEH WITH THREE DOTS POINTING UPWARDS BELOW | フラニ語西部方言(プラー語)、ザルマ語(ニジェール国内で)、ソンガイ語(ニジェール国内で)[1][2]、ウォロフ語 | |
U+0753 | ݓ | ARABIC LETTER BEH WITH THREE DOTS POINTING UPWARDS BELOW AND TWO DOTS ABOVE | ハウサ語[1][2] | |
U+0754 | ݔ | ARABIC LETTER BEH WITH TWO DOTS BELOW AND DOT ABOVE | ザルマ語(マリ国内で)、ソンガイ語(マリ国内で)、フラニ語[1][2] | |
U+0755 | ݕ | ARABIC LETTER BEH WITH INVERTED SMALL V BELOW | フラニ語西部方言(プラー語)、ザルマ語(ニジェール国内で)、ソンガイ語(ニジェール国内で)[1][2] | |
U+0756 | ݖ | ARABIC LETTER BEH WITH SMALL V | フラニ語、ザルマ語、ソンガイ語[1][2]、ウォロフ語 | |
U+0757 | ݗ | ARABIC LETTER HAH WITH TWO DOTS ABOVE | ザルマ語(マリ国内で)、ソンガイ語(マリ国内で)、フラニ語東部方言(フルフルディ語)[1][2] | |
U+0758 | ݘ | ARABIC LETTER HAH WITH THREE DOTS POINTING UPWARDS BELOW | ザルマ語(ニジェール国内で)、ソンガイ語(ニジェール国内で)[1][2] | |
U+0759 | ݙ | ARABIC LETTER DAL WITH TWO DOTS VERTICALLY BELOW AND SMALL TAH | サライキ語[4][5]
子音[ᶑ]を表す。 |
|
U+075A | ݚ | ARABIC LETTER DAL WITH INVERTED SMALL V BELOW | アフリカのいくつかの言語で[ɗ]を表す。[1][6] | |
U+075B | ݛ | ARABIC LETTER REH WITH STROKE | アフリカのいくつかの言語で[ɽ]を表す。[1][7] | |
U+075C | ݜ | ARABIC LETTER SEEN WITH FOUR DOTS ABOVE | シナー語[4][5]、トルワル語 | |
U+075D | ݝ | ARABIC LETTER AIN WITH TWO DOTS ABOVE | ソンガイ語、フラニ語東部方言(フルフルディ語)[1] | |
U+075E | ݞ | ARABIC LETTER AIN WITH THREE DOTS POINTING DOWNWARDS ABOVE | ハウサ語、ザルマ語(ニジェール国内で)、ソンガイ語(ニジェール国内で)[1] | |
U+075F | ݟ | ARABIC LETTER AIN WITH TWO DOTS VERTICALLY ABOVE | ザルマ語(マリ国内で)、ソンガイ語(マリ国内で)[1] | |
U+0760 | ݠ | ARABIC LETTER FEH WITH TWO DOTS BELOW | フラニ語東部方言(フルフルディ語)、ザルマ語(マリ国内で)、ソンガイ語(マリ国内で)[1]
子音[p]を表す。 |
|
U+0761 | ݡ | ARABIC LETTER FEH WITH THREE DOTS POINTING UPWARDS BELOW | アフリカのいくつかの言語で[β]を表す。[1] | |
U+0762 | ݢ | ARABIC LETTER KEHEH WITH DOT ABOVE | ジャウィ文字で用いられる。U+06AC ڬよりもこちらを使う方が好ましい。[4][8]
子音[ɡ]を表す。 |
|
U+0763 | ݣ | ARABIC LETTER KEHEH WITH THREE DOTS ABOVE | アラビア語モロッコ方言(ダリジャ)、ベルベル語、[8]ブルシャスキー語[4][8]
ベルベル語では子音[ɡ]を表す。 |
|
U+0764 | ݤ | ARABIC LETTER KEHEH WITH THREE DOTS POINTING UPWARDS BELOW | アフリカのいくつかの言語で[ɠ̊]を表す。[1][9] | |
U+0765 | ݥ | ARABIC LETTER MEEM WITH DOT ABOVE | フラニ語東部方言(フルフルディ語)[1]
子音[ɓ]を表す。 |
|
U+0766 | ݦ | ARABIC LETTER MEEM WITH DOT BELOW | マバ語[4][2] | |
U+0767 | ݧ | ARABIC LETTER NOON WITH TWO DOTS BELOW | アルウィー語(アラブ・タミル語とも呼ばれる)[4]、アフリカのいくつかの言語[1]、ウォロフ語
子音[ɲ]を表す。 |
|
U+0768 | ݨ | ARABIC LETTER NOON WITH SMALL TAH | サライキ語、パハリ・ポスワリ語[4][5]、シナー語、シャームキー文字(西パンジャーブ語、ラフンダー語)
子音[ɳ]を表す。 |
|
U+0769 | ݩ | ARABIC LETTER NOON WITH SMALL V | グジャール語[4][5] | |
U+076A | ݪ | ARABIC LETTER LAM WITH BAR | マールワーリー語[10]
子音[𝼈](反り舌側面弾き音、[ɭ̆]あるいは[ɺ̢]とも書かれる)を表す。 |
|
U+076B | ݫ | ARABIC LETTER REH WITH TWO DOTS VERTICALLY ABOVE | トルワル語、オルムル語[4][11]
オルムル語では子音[ʑ]を表す。 |
|
U+076C | ݬ | ARABIC LETTER REH WITH HAMZA ABOVE | オルムル語[4][11]
有声歯茎硬口蓋摩擦音[ʑ]を表す。[4] |
|
U+076D | ݭ | ARABIC LETTER SEEN WITH TWO DOTS VERTICALLY ABOVE | カラム語、オルムル語[4][11]
オルムル語では子音[ɕ]を表す。 |
|
コワール語用の追加 | ||||
U+076E | ݮ | ARABIC LETTER HAH WITH SMALL ARABIC LETTER TAH BELOW | 子音[ɖ͡ʐ]を表す。[12] | |
U+076F | ݯ | ARABIC LETTER HAH WITH SMALL ARABIC LETTER TAH AND TWO DOTS | 子音[ʈ͡ʂ]を表す。[12] | |
U+0770 | ݰ | ARABIC LETTER SEEN WITH SMALL ARABIC LETTER TAH AND TWO DOTS | 子音[ʂ]を表す。[12] | |
U+0771 | ݱ | ARABIC LETTER REH WITH SMALL ARABIC LETTER TAH AND TWO DOTS | 子音[ʐ]を表す。[12] | |
トルワル語用の追加 | ||||
U+0772 | ݲ | ARABIC LETTER HAH WITH SMALL ARABIC LETTER TAH ABOVE | 子音[ɖ͡ʐ]を表す。[12] | |
ブルシャスキー語用の追加 | ||||
U+0773 | ݳ | ARABIC LETTER ALEF WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE | 短母音の[a]を表す。なお、ブルシャスキー語において通常のアリフは緊張を伴わない長母音[aː]を表す。[12] | |
U+0774 | ݴ | ARABIC LETTER ALEF WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE | 緊張を伴う長母音[ˈaː]を表す。ラテン文字での翻字ではáaと鋭アクセント記号を用いて表される。[12] | |
U+0775 | ݵ | ARABIC LETTER FARSI YEH WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE | 短母音[i]を表す。[12] | |
U+0776 | ݶ | ARABIC LETTER FARSI YEH WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE | 緊張を伴う長母音[ˈiː]を表す。[12] | |
U+0777 | ݷ | ARABIC LETTER FARSI YEH WITH EXTENDED ARABIC-INDIC DIGIT FOUR BELOW | 子音[ɻ]を表す。[12] | |
U+0778 | ݸ | ARABIC LETTER WAW WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE | 短母音[o]を表す。[12] | |
U+0779 | ݹ | ARABIC LETTER WAW WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE | 緊張を伴う長母音[ˈoː]を表す。[12] | |
U+077A | ݺ | ARABIC LETTER YEH BARREE WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE | 短母音[e]を表す。[12] | |
U+077B | ݻ | ARABIC LETTER YEH BARREE WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE | 緊張を伴う長母音[ˈeː]を表す。[12] | |
U+077C | ݼ | ARABIC LETTER HAH WITH EXTENDED ARABIC-INDIC DIGIT FOUR BELOW | 子音[t͡sʰ]を表す。[12] | |
U+077D | ݽ | ARABIC LETTER SEEN WITH EXTENDED ARABIC-INDIC DIGIT FOUR ABOVE | 子音[ʂ]を表す。[12] | |
早期ペルシャ語用の追加 | ||||
U+077E | ݾ | ARABIC LETTER SEEN WITH INVERTED V | 12世紀~13世紀のペルシア語正書法で使用されており、[s]または類似のさまざまな音素を表す可能性がある。 現代ペルシャ語では、 [s] の音で発音され、U+0633 س ARABIC LETTER SEEN で書かれる。[13] | |
U+077F | ݿ | ARABIC LETTER KAF WITH TWO DOTS ABOVE | ペルシア語の方言の音素[ɡ]または鼻音化された[ŋ]を表すために使用された。 後の正書法では、これらは通常、 U+06AF گ ARABIC LETTER GAF 、 U+06AB ګ ARABIC LETTER KAF WITH RING 、または U+06AD ڭ ARABIC LETTER NG のいずれかに置き換えられた。[13] |
小分類
[編集]このブロックの小分類は「拡張アラビア文字」(Extended Arabic letters)、「コワール語用の追加」(Additions for Khowar)、「トルワル語用の追加」(Addition for Torwali)、「ブルシャスキー語用の追加」(Additions for Burushaski)、「早期ペルシャ語用の追加」(Additions for early Persian)の6つとなっている。[4]
拡張アラビア文字(Extended Arabic letters)
[編集]この小分類にはアラビア文字のうち、主にアフリカの諸言語の正書法で使用される文字を収録している。[4]Unicodeのバージョン4.1で本ブロックと共に追加された。
コワール語用の追加(Additions for Khowar)
[編集]この小分類にはアラビア文字のうち、パキスタンのカイバル・パクトゥンクワ州のチトラル、ギルギット・バルティスタンのギザル県、上スワートの一部などで話されているインド・ヨーロッパ語族インド・イラン語派ダルド語群に属するコワール語(チトラリー語)用の追加文字が収録されている。Unicodeのバージョン5.1で追加された。
トルワル語用の追加(Addition for Torwali)
[編集]この小分類にはアラビア文字のうち、パキスタンのカイバル・パクトゥンクワ州のスワートとコヒスタンに居住するトルワル人の間で話されているインド・ヨーロッパ語族インド・イラン語派ダルド語群に属するトルワル語用の追加文字が1文字のみ収録されている。Unicodeのバージョン5.1で追加された。
ブルシャスキー語用の追加(Additions for Burushaski)
[編集]この小分類にはアラビア文字のうち、パキスタン北部のカラコルム山脈及びヒンドゥークシュ山脈などに居住するブルショー人の間で話されている系統的に孤立した言語のブルシャスキー語を表記するための追加文字が収録されている。Unicodeのバージョン5.1で追加された。
早期ペルシャ語用の追加(Additions for early Persian)
[編集]この小分類には10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語(総称して早期ペルシャ語(英語: early Persian)と呼ばれる)の正書法にかつて用いられていた文字[13]を2文字収録している。Unicodeのバージョン5.1で追加された。
文字コード
[編集]アラビア文字補助(Arabic Supplement)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+075x | ݐ | ݑ | ݒ | ݓ | ݔ | ݕ | ݖ | ݗ | ݘ | ݙ | ݚ | ݛ | ݜ | ݝ | ݞ | ݟ |
U+076x | ݠ | ݡ | ݢ | ݣ | ݤ | ݥ | ݦ | ݧ | ݨ | ݩ | ݪ | ݫ | ݬ | ݭ | ݮ | ݯ |
U+077x | ݰ | ݱ | ݲ | ݳ | ݴ | ݵ | ݶ | ݷ | ݸ | ݹ | ݺ | ݻ | ݼ | ݽ | ݾ | ݿ |
注釈
|
履歴
[編集]以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
4.1 | U+0759,075C,0768..0769 | 4 | L2/02-274 | Jonathan Kew (2 August 2002), Proposal for extensions to the Arabic block (英語) |
L2/03-210 | Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語) | |||
L2/03-223 | Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語) | |||
U+0750..0758,075A..075B,075D..0761,0764..0767 | 20 | L2/03-044 | Jonathan Kew (11 February 2003), Encoding Arabic extensions: options for the future of Unicode (英語) | |
L2/03-051 | Jonathan Kew (18 February 2003), Images of potential extended Arabic characters (英語) | |||
L2/03-168 | Jonathan Kew (30 May 2003), Proposal to encode Arabic-script letters for African languages (英語) | |||
L2/03-210 | Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語) | |||
L2/03-223 | Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語) | |||
U+0762..0763 | 2 | L2/03-176 | Jonathan Kew (8 June 2003), Proposal to encode Jawi and Moroccan Arabic GAF characters (英語) | |
L2/03-210 | Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語) | |||
L2/03-223 | Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語) | |||
U+076A | 1 | L2/03-228 | Jonathan Kew (29 July 2003), Proposal to encode Marwari Lam with Bar Character (英語) | |
U+076B..076D | 3 | L2/04-025 | Jonathan Kew (21 January 2004), Proposal to encode 5 new Arabic script characters [WG2-N2723] (英語) | |
5.1 | U+076E..077D | 16 | L2/06-149 | Elena Bashir; Sarmad Hussain; Deborah Anderson (9 May 2006), Proposal to add characters needed for Khowar, Torwali, and Burushaski (英語) |
L2/06-150 | Elena Bashir (9 May 2006), Letters of support for characters needed for Khowar, Torwali, and Burushaski (英語) | |||
U+077E..077F | 2 | L2/06-345 | Michael Everson; Roozbeh Pournader; Elnaz Sarbar (8 November 2006), Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised) (英語) | |
|
出典
[編集]- ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af Jonathan Kew (2003年2月18日). “Images of potential extended Arabic characters” (英語). Unicode. 2024年2月20日閲覧。
- ^ a b c d e f g h i j k l m n o p q r s t Jonathan Kew (2003年5月30日). “Proposal to encode Arabic-script letters for African languages” (英語). Unicode. 2024年2月20日閲覧。
- ^ 原文ではラテン文字で"ƴ"と転写されており、これはハウサ語で子音/ʔʲ/を表す文字である。現代のフラニ語では通常、ラテン文字で"yy"と綴られる。
- ^ a b c d e f g h i j k l m n "The Unicode Standard, Version 15.1 - U0750.pdf" (PDF). The Unicode Standard (英語). 2024年2月20日閲覧。
- ^ a b c d e f Jonathan Kew (2002年8月2日). “Proposal for extensions to the Arabic block” (英語). Unicode. 2024年2月20日閲覧。
- ^ 原文では”ɗ”のフックが左右逆向きに付いた記号が使われている。
- ^ 原文では"ṛ"と表記されている。他のドットビローが付いた子音の発音と比較するに、/r/の反舌音を表しているものと見られる。
- ^ a b c Jonathan Kew (2003年6月8日). “Proposal to encode Jawi and Moroccan Arabic GAF characters” (英語). Unicode. 2024年2月20日閲覧。
- ^ 原文では"ƙ"のフックを左右逆向きにしたような記号が用いられている。"ƙ"はIPA(国際音声記号)においてかつて無声軟口蓋入破音を表していた記号だが、のちに廃止されたものである。
- ^ Jonathan Kew (2003年7月29日). “Proposal to encode Marwari Lam with Bar Character” (英語). Unicode. 2024年2月20日閲覧。
- ^ a b c Jonathan Kew (2004年1月21日). “Proposal to encode 5 new Arabic script characters [WG2-N2723]” (英語). Unicode. 2024年2月20日閲覧。
- ^ a b c d e f g h i j k l m n o p Elena Bashir; Sarmad Hussain, Deborah Anderson (2006年5月9日). “Proposal to add characters needed for Khowar, Torwali, and Burushaski” (英語). Unicode. 2024年2月20日閲覧。
- ^ a b c Michael Everson; Roozbeh Pournader, Elnaz Sarbar (2006年11月8日). “Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised)” (英語). Unicode. 2024年2月20日閲覧。