線スペクトル対
From Wikipedia, the free encyclopedia
数学的基礎
声道を固定長で一定の直径を持つ音響管の並びとしてモデル化した時、線スペクトル対は声門を開いたときと閉じたときそれぞれでの共振周波数の組にあたるパラメータである。くちびる側は完全開放のため反射係数が-1と見なし、声門側は開いたときの反射係数を1、閉じたときの反射係数を-1とモデル化すると、両端でのエネルギー損失が無いため声道全体が無損失系となり、音響管の伝達関数は線スペクトル状になる。この線スペクトルの周波数のペアで線形予測係数を表現するため、線スペクトル対という名称で呼ばれる。
ここで実数の係数 は線形予測係数である。 この式は以下の2つの式に分解できる。
ここで P(z) は声門が完全に閉じたとき(反射係数 -1)に対応し、Q(z) は声門が完全に開いたとき(反射係数 1)に対応する。この式が LSP 多項式である[2]。 線スペクトル対の値はこの多項式の根で表される。
元の多項式 A(z) は以下の式から容易に復元できる。
多項式 A(z) の全ての根がz平面上の の単位円の内部にある時、P(z) = 0 の根と Q(z) = 0 の根はどちらもすべて単位円周上にあることが示せて、これを利用して根の実部cos ωと対応する線スペクトル対の各周波数 ωi を求める。
P(z) と Q(z) の根にそれぞれ対応するωは必ず交互に相手のものを間に挟むので,以下のように並べることができる。
また、この条件は線スペクトル対を使った合成フィルターが安定であるための必要十分条件でもあることが示されている[3][4]。
LSP 分析
線形予測係数を線スペクトル対に変換するためには、P(z) = 0, Q(z) = 0 の根を求める必要がある。以下では単純化のために線形予測多項式 A(z) の次数が偶数 の場合を考える。この時 LSP 多項式の P(z)、Q(z) は 次の多項式になる。
LSP 多項式の P(z) と Q(z) はそれぞれ と で割り切れる。残りの多項式は で割り切れ、単位円上では と表現できる。すなわち、P(z) と Q(z) は以下のように因数分解できる。
この式の根を求めることで線スペクトル対 ωi が計算できる。
(1) 線形予測係数 から P(z)、Q(z) の各係数を計算
- P(z)、Q(z) の定義を用い以下の式で計算。多項式の係数を とすると、
(2) P(z)、Q(z) それぞれを 、 で割る
- 単位円上の根からの実根除去に相当。
- この多項式の除算は係数の加減算により計算可能で、除算後の多項式の係数を とすると、
(3) 除算後の多項式 P'(z)、Q'(z) を で置き換え
- 残った複素共役根の実軸への射影に相当。置き換え後の式はチェビシェフ多項式で表現できる[5]。
- P'(z)、Q'(z) は x に関する N/2 次の多項式になり、多項式の係数は から機械的に計算できる。
(4) x を変数とする2つの方程式をニュートン・ラプソン法で解く
- 区間(-1, 1)内に根 が交互に存在し、2つの方程式を交互に解くことで高速に求めることが可能。
(5) 求めた根から線スペクトル対 ωi を計算
- 求めた N 個の根 から以下の式で ωi を求める。
線スペクトル対を線形予測係数に変換する場合はより単純で、上記とは逆に、線スペクトル対 ωi から P(z)、Q(z) の各係数を計算し、
を求めればよい。
P(z)、Q(z) の各係数は、 の形式の2次多項式の積を求め、さらに あるいは を掛けた式の係数として機械的に計算できる。
P(z)、Q(z) の係数には対称性があるため、N/2 次の係数から以下の式で線形予測係数に変換できる[6]。