ソグド文字 (Unicodeのブロック)

範囲 U+10F30..U+10F6F
(64 個の符号位置)

主な言語・文字体系

ソグド語

ソグド文字 (Unicodeのブロック)
Sogdian
範囲	U+10F30..U+10F6F (64 個の符号位置)
面	追加多言語面
用字	ソグド文字
主な言語・文字体系	ソグド語
割当済	42 個の符号位置
未使用	22 個の保留
Unicodeのバージョン履歴

11.0	42 (+42)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

ソグド文字（ソグドもじ、英語: Sogdian）は、Unicodeのブロックの一つ。

かつて現在のウズベキスタン東部のサマルカンド、フェルガナやタジキスタン西部のパンジケントなどの中央アジアでペルシア系のソグド人に話されていた、インド・ヨーロッパ語族インド・イラン語派イラン語群のソグド語を表記するためのソグド文字のうち、6世紀以降に用いられた、文字同士が連結するものを収録している。ソグド文字はモンゴル文字などの祖先にあたる。

なお、ソグド文字には「正体(formal)」と呼ばれる書体と「草書体(cursive)」と呼ばれる書体があるが、Unicodeではいずれも本ブロックに符号位置を統合されており、Unicode公式の表に掲載されている代表的なグリフは「正体」スタイルに基づいている^[1]^[2]。

ソグド文字は古ソグド文字から派生した文字体系であり、音素文字のうち基本的に母音を表記せず、子音字のみで綴られるアブジャドに分類される。書字方向には横書きの場合と縦書きの場合とがあり、横書きの場合はアラビア文字やヘブライ文字などと同様に右から左への横書き(右横書き)でありる。縦書きの場合は文字が反時計回りに90度回転し、モンゴル文字などと同様に左から右へと行を送る(左縦書き)。単語毎に分かち書きをし、スペースで単語を区切る^[2]。

アラビア文字のように単語内における位置（独立・語頭・語中・語末）によって字形が変化する。なお、文字の語内位置による字形変化を説明する場合はゼロ幅接合子(U+200D; ZWJ)を用いることで、その字形を表現することができる。例えば字母aleph(U+10F30 𐼰)の語中形は‍𐼰‍U+200D U+10F30 U+200Dの形で表すことができる。

加えて、アラビア文字やタイ文字などと同様に独自の数字体系(ソグド数字)を有している。

符号位置の順序はアラム文字の順序に従っている^[3]。

Unicodeのバージョン11.0において初めて追加された。

収録文字

コード	文字（独立形）	文字名（英語）	語頭形	語中形	語末形	用例・説明	ラテン文字転写
字母
U+10F30	𐼰	SOGDIAN LETTER ALEPH	𐼰‍	‍𐼰‍	‍𐼰	子音[ʔ]を表す。	ʾ
U+10F31	𐼱	SOGDIAN LETTER BETH	𐼱‍	‍𐼱‍	‍𐼱	子音[b]を表す。筆記体ではyodhと同一の字形になるため、しばしば区別のため上部に点が付けられる^[2]。	b
U+10F32	𐼲	SOGDIAN LETTER GIMEL	𐼲‍	‍𐼲‍	‍𐼲	子音[ɡ]を表す。	g
U+10F33	𐼳	SOGDIAN LETTER HE	𐼳‍	‍𐼳‍	‍𐼳	子音[h]を表す。語末でのみ用いられるため、語頭形・語中形が存在しない^[3]。	h
U+10F34	𐼴	SOGDIAN LETTER WAW	𐼴‍	‍𐼴‍	‍𐼴	子音[w]を表す。	w
U+10F35	𐼵	SOGDIAN LETTER ZAYIN	𐼵‍	‍𐼵‍	‍𐼵	子音[z]を表す。	z
U+10F36	𐼶	SOGDIAN LETTER HETH	𐼶‍	‍𐼶‍	‍𐼶	子音[ħ]を表す。語頭形・語中形はgimelと同一の字形となる^[2]。	ḥ
U+10F37	𐼷	SOGDIAN LETTER YODH	𐼷‍	‍𐼷‍	‍𐼷	子音[j]を表す。筆記体ではbethと同一の字形になる^[2]。	y
U+10F38	𐼸	SOGDIAN LETTER KAPH	𐼸‍	‍𐼸‍	‍𐼸	子音[k]を表す。	k
U+10F39	𐼹	SOGDIAN LETTER LAMEDH	𐼹‍	‍𐼹‍	‍𐼹	子音[l]を表す。	l
U+10F3A	𐼺	SOGDIAN LETTER MEM	𐼺‍	‍𐼺‍	‍𐼺	子音[m]を表す。	m
U+10F3B	𐼻	SOGDIAN LETTER NUN	𐼻‍	‍𐼻‍	‍𐼻	子音[n]を表す。	n
U+10F3C	𐼼	SOGDIAN LETTER SAMEKH	𐼼‍	‍𐼼‍	‍𐼼	子音[s]を表す。	s
U+10F3D	𐼽	SOGDIAN LETTER AYIN	𐼽‍	‍𐼽‍	‍𐼽	子音[ʕ]を表す。アラム語のヘテログラム（英語版）(他の言語から借用されて一塊で表語文字のように扱われる文字列)ʿDでのみ使用される^[1]。	ʿ
U+10F3E	𐼾	SOGDIAN LETTER PE	𐼾‍	‍𐼾‍	‍𐼾	子音[p]を表す。	p
U+10F3F	𐼿	SOGDIAN LETTER SADHE	𐼿‍	‍𐼿‍	‍𐼿	子音[sˤ]を表す。	ṣ
U+10F40	𐽀	SOGDIAN LETTER RESH-AYIN	𐽀‍	‍𐽀‍	‍𐽀	子音[r]或いは[ʕ]を表す。	r/ʿ
U+10F41	𐽁	SOGDIAN LETTER SHIN	𐽁‍	‍𐽁‍	‍𐽁	子音[ʃ]を表す。	š
U+10F42	𐽂	SOGDIAN LETTER TAW	𐽂‍	‍𐽂‍	‍𐽂	子音[t]を表す。	t
U+10F43	𐽃	SOGDIAN LETTER FETH	𐽃‍	‍𐽃‍	‍𐽃	子音[f]を表す^[2]。	f
U+10F44	𐽄	SOGDIAN LETTER LESH	𐽄‍	‍𐽄‍	‍𐽄	子音[l]を表す^[2]。	l
表音文字
U+10F45	𐽅	SOGDIAN INDEPENDENT SHIN				`U+10F41 𐽁 SOGDIAN LETTER SHIN`の異体字。中国語の所/suǒ/の転写に用いられた^[2]。	š^[2]
結合記号
U+10F46	𐽆	SOGDIAN COMBINING DOT BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̣
U+10F47	𐽇	SOGDIAN COMBINING TWO DOTS BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̤
U+10F48	𐽈	SOGDIAN COMBINING DOT ABOVE				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̇
U+10F49	𐽉	SOGDIAN COMBINING TWO DOTS ABOVE				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̈
U+10F4A	𐽊	SOGDIAN COMBINING CURVE ABOVE				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[3]。例えばtaw/t/に付いて/ṭ/を表す^[3]。	̑
U+10F4B	𐽋	SOGDIAN COMBINING CURVE BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[3]。例えば字母heth/ḥ/に付いて/h/を、resh/r/に付いて/l/を表す^[3]。	̮
U+10F4C	𐽌	SOGDIAN COMBINING HOOK ABOVE				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̇
U+10F4D	𐽍	SOGDIAN COMBINING HOOK BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̣
U+10F4E	𐽎	SOGDIAN COMBINING LONG HOOK BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̣
U+10F4F	𐽏	SOGDIAN COMBINING RESH BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̣
U+10F50	𐽐	SOGDIAN COMBINING STROKE BELOW				外来語などにおいて字母の異音を表し、子音が変化したことを表す^[2]。	̣
数値
U+10F51	𐽑	SOGDIAN NUMBER ONE	𐽑‍	‍𐽑‍	‍𐽑	単位数字の1
U+10F52	𐽒	SOGDIAN NUMBER TEN	𐽒‍	‍𐽒‍	‍𐽒	単位数字の10
U+10F53	𐽓	SOGDIAN NUMBER TWENTY	𐽓‍	‍𐽓‍	‍𐽓	単位数字の20
U+10F54	𐽔	SOGDIAN NUMBER ONE HUNDRED	𐽔‍	‍𐽔‍	‍𐽔	単位数字の100
約物
U+10F55	𐽕	SOGDIAN PUNCTUATION TWO VERTICAL BARS				一般的な句読点であり、単語の境界、主要なセクションの終わり、テキスト全体など、様々な長さのテキストセグメントを区切るために使用される^[2]^[3]。
U+10F56	𐽖	SOGDIAN PUNCTUATION TWO VERTICAL BARS WITH DOTS
U+10F57	𐽗	SOGDIAN PUNCTUATION CIRCLE WITH DOT
U+10F58	𐽘	SOGDIAN PUNCTUATION TWO CIRCLES WITH DOTS
U+10F59	𐽙	SOGDIAN PUNCTUATION HALF CIRCLE WITH DOT				テキストの終了を示す^[3]。

小分類

このブロックの小分類は「字母」（Letters）、「表音文字」（Phonogram）、「結合記号」（Combining marks）、「数値」（Numbers）、「約物」（Punctuation）の5つとなっている^[1]。

字母（Letters）

この小分類にはソグド文字のうち、基本的な字母が収録されている。

表音文字（Phonogram）

この小分類にはソグド文字のうち、なんちゃらかんちゃらが収録されている。

結合記号（Combining marks）

この小分類にはソグド文字のうち、他の字母に結合する、文字幅を持たない結合記号（ダイアクリティカルマーク）が収録されている。

数値（Numbers）

この小分類にはソグド文字のうち、位取り記数法を用いず、単位数字を並べて表現する数値記号(Unicode上では10進法の位取り記数法を用いる"digit"とは区別される)が収録されている。

約物（Punctuation）

この小分類にはソグド文字で用いられる句読点などの約物類が収録されている。

文字コード

ソグド文字(Sogdian)^[1] Official Unicode Consortium code chart (PDF)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+10F3x	𐼰	𐼱	𐼲	𐼳	𐼴	𐼵	𐼶	𐼷	𐼸	𐼹	𐼺	𐼻	𐼼	𐼽	𐼾	𐼿
U+10F4x	𐽀	𐽁	𐽂	𐽃	𐽄	𐽅	𐽆	𐽇	𐽈	𐽉	𐽊	𐽋	𐽌	𐽍	𐽎	𐽏
U+10F5x	𐽐	𐽑	𐽒	𐽓	𐽔	𐽕	𐽖	𐽗	𐽘	𐽙
U+10F6x
注釈 1.^バージョン16.0時点

バージョン	コードポイント^[a]	文字数	L2 ID	ドキュメント
11.0	U+10F30..10F59	42	L2/16-158	Anshuman Pandey (10 May 2016), Preliminary proposal to encode Sogdian in Unicode (英語)
11.0	U+10F30..10F59	42	L2/16-371	Anshuman Pandey (25 January 2017), Revised proposal to encode the Sogdian script (revised) (英語)
↑ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。