古ウイグル文字 (Unicodeのブロック)
From Wikipedia, the free encyclopedia
8世紀から17世紀ごろ[1]にかけて、現在の中華人民共和国新疆ウイグル自治区にあたる地域に存在していた天山ウイグル王国をはじめとした中央アジア全域[1]で話されていた、テュルク語族シベリア・テュルク語群に属する古ウイグル語(回鶻語)や、周辺で話されるテュルク諸語、中国語、モンゴル語、ソグド語、チベット語において宗教、文学、行政文書の記録を表記するための古ウイグル文字を収録している。モンゴル文字の祖先にあたる文字体系である。
この文字には、楷書体(square)と草書体(cursive)の2つの主要な書体が存在する[1]が、Unicode上ではこれらを同一の文字体系として統合している。
古ウイグル文字はソグド文字から派生した文字体系であり、音素文字のうち基本的に母音を表記せず、子音字のみで綴られるアブジャドに分類される。書字方向には横書きと縦書き両方が存在し、横書きの場合はアラビア文字やヘブライ文字などと同様に右から左への横書き(右横書き)であり、縦書きの場合はグリフが反時計回りに 90 度回転し、モンゴル文字のように左から右へと行を送る縦書き(左縦書き)である。Unicode上では右横書き用の文字として定義されている[2]。一般的には縦書きで書かれる[1]。
アラビア文字のように単語内での位置(独立・語頭・語中・語末)によって字形が変化し、単語毎に分かち書きをする。なお、文字の語内位置による字形変化を説明する場合はゼロ幅接合子(U+200D; ZWJ)を用いることで、その字形を表現することができる。例えば字母aleph(U+10F70 𐽰)の語中形は𐽰U+200D U+10F70 U+200Dの形で表すことができる。
符号位置の順序はおおむね伝統的な古ウイグル文字の順序に従っている。
Unicodeのバージョン14.0において初めて追加された。
収録文字
| コード | 文字
(独立形) |
文字名(英語) | 語頭形 | 語中形 | 語末形 | 用例・説明 | ラテン文字転写 |
|---|---|---|---|---|---|---|---|
| 字母 | |||||||
| U+10F70 | 𐽰 | OLD UYGHUR LETTER ALEPH | 𐽰 | 𐽰 | 𐽰 | 子音[ʔ]を表す。 | ʾ |
| U+10F71 | 𐽱 | OLD UYGHUR LETTER BETH | 𐽱 | 𐽱 | 𐽱 | 子音[b]を表す。 | b |
| U+10F72 | 𐽲 | OLD UYGHUR LETTER GIMEL-HETH | 𐽲 | 𐽲 | 𐽲 | 子音[ɡ]或いは[ħ]を表す。 | g/ḥ |
| U+10F73 | 𐽳 | OLD UYGHUR LETTER WAW | 𐽳 | 𐽳 | 𐽳 | 子音[w]を表す。 | w |
| U+10F74 | 𐽴 | OLD UYGHUR LETTER ZAYIN | 𐽴 | 𐽴 | 𐽴 | 子音[z]を表す。 | z |
| U+10F75 | 𐽵 | OLD UYGHUR LETTER FINAL HETH | 𐽵 | 𐽵 | 𐽵 | 子音[ħ]を表す。語末でのみ用いられる。 | ḥ |
| U+10F76 | 𐽶 | OLD UYGHUR LETTER YODH | 𐽶 | 𐽶 | 𐽶 | 子音[j]を表す。 | y |
| U+10F77 | 𐽷 | OLD UYGHUR LETTER KAPH | 𐽷 | 𐽷 | 𐽷 | 子音[k]を表す。 | k |
| U+10F78 | 𐽸 | OLD UYGHUR LETTER LAMEDH | 𐽸 | 𐽸 | 𐽸 | 子音[l]を表す。 | l |
| U+10F79 | 𐽹 | OLD UYGHUR LETTER MEM | 𐽹 | 𐽹 | 𐽹 | 子音[m]を表す。 | m |
| U+10F7A | 𐽺 | OLD UYGHUR LETTER NUN | 𐽺 | 𐽺 | 𐽺 | 子音[n]を表す。 | n |
| U+10F7B | 𐽻 | OLD UYGHUR LETTER SAMEKH | 𐽻 | 𐽻 | 𐽻 | 子音[s]を表す。 | s |
| U+10F7C | 𐽼 | OLD UYGHUR LETTER PE | 𐽼 | 𐽼 | 𐽼 | 子音[p]を表す。 | p |
| U+10F7D | 𐽽 | OLD UYGHUR LETTER SADHE | 𐽽 | 𐽽 | 𐽽 | 子音[sˤ]を表す。 | ṣ |
| U+10F7E | 𐽾 | OLD UYGHUR LETTER RESH | 𐽾 | 𐽾 | 𐽾 | 子音[r]を表す。 | r |
| U+10F7F | 𐽿 | OLD UYGHUR LETTER SHIN | 𐽿 | 𐽿 | 𐽿 | 子音[ʃ]を表す。 | š |
| U+10F80 | 𐾀 | OLD UYGHUR LETTER TAW | 𐾀 | 𐾀 | 𐾀 | 子音[t]を表す。 | t |
| U+10F81 | 𐾁 | OLD UYGHUR LETTER LESH | 𐾁 | 𐾁 | 𐾁 | 子音[l]を表す。 | l |
| 結合記号 | |||||||
| U+10F82 | 𐾂 | OLD UYGHUR COMBINING DOT ABOVE | |||||
| U+10F83 | 𐾃 | OLD UYGHUR COMBINING DOT BELOW | 特定の書体において形状が類似する文字を区別したり、書体中に固有の文字が存在しない音を示すために用いられる[1]。 | ̣ | |||
| U+10F84 | 𐾄 | OLD UYGHUR COMBINING TWO DOTS ABOVE | |||||
| U+10F85 | 𐾅 | OLD UYGHUR COMBINING TWO DOTS BELOW | 特定の書体において形状が類似する文字を区別したり、書体中に固有の文字が存在しない音を示すために用いられる[1]。 | ̤ | |||
| 約物 | |||||||
| U+10F86 | 𐾆 | OLD UYGHUR PUNCTUATION BAR | 短いセグメントを区切る句読点[1]。 | ||||
| U+10F87 | 𐾇 | OLD UYGHUR PUNCTUATION TWO BARS | 長いセクションを区切る句読点[1]。 | ||||
| U+10F88 | 𐾈 | OLD UYGHUR PUNCTUATION TWO DOTS | テキストの大部分の終了を表す[1]。 | ||||
| U+10F89 | 𐾉 | OLD UYGHUR PUNCTUATION FOUR DOTS | セクションの終了またはテキストの終了を表す[1]。 | ||||
小分類
このブロックの小分類は「字母」(Letters)、「結合記号」(Combining signs)、「約物」(Punctuation)の3つとなっている[3]。
字母(Letters)
この小分類には古ウイグル文字のうち、基本的な字母が収録されている。
結合記号(Combining signs)
この小分類には古ウイグル文字のうち、他の字母に結合する、文字幅を持たない結合記号(ダイアクリティカルマーク)が収録されている。