行列の平方根

数学 > 線型代数学 > 行列値関数 > 行列の平方根

数学のおもに線型代数学および函数解析学における行列の平方根（ぎょうれつのへいほうこん、英: square root of a matrix）は、数に対する通常の平方根の概念を行列に対して拡張するものである。すなわち、行列 $B$ が行列 $A$ の平方根であるとは、行列の積に関して $B 2 = BB$ が $A$ に等しいときに言う。

「実数の平方根は必ずしも実数にならないが、複素数は必ず複素数の範囲で平方根を持つ」ことに対応する事実として、実行列の平方根は（存在しても）必ずしも実行列にならないが、複素行列が平方根を持てばそれは必ず複素行列の範囲で取れる。

平方根を持たない行列も存在する^{[注 1]}。

また一般に、ひとつの行列が複数の平方根を持ち得る^{[注 2]}。実際、 $2 \times 2$ 単位行列は次のように無数の平方根を持つ。 ${\begin{bmatrix}{\sqrt {1-bc}}&b\\c&-{\sqrt {1-bc}}\end{bmatrix}},\quad {\begin{bmatrix}-{\sqrt {1-bc}}&b\\c&{\sqrt {1-bc}}\end{bmatrix}},\quad {\begin{bmatrix}1&0\\0&1\end{bmatrix}},\quad {\begin{bmatrix}-1&0\\0&-1\end{bmatrix}}$

このように行列の平方根は無数に存在しうるが、半正定値行列^{[注 3]}の範疇で行列の主平方根 (principal square root) の概念が定義できて「半正定値行列の主平方根はただ一つ」である（これは「非負実数が非負の平方根（主平方根）をただ一つだけ持つ」という事実に対応する）。

$2 \times 2$ 行列が、相異なる二つの非零固有値を持つならば、それは四つの平方根を持つ（より一般に、相異なる $n$ 個の非零固有値を持つ $n \times n$ 行列は $2 n$ 個の平方根を持つ）。実際に、そのような仮定を満たす行列 $A$ は $A$ の固有ベクトルを列ベクトルに持つ行列 $V$ とそれに対応する固有値を対角成分に持つ対角行列 $D$ を用いて $A = VDV -1$ と固有値分解できるから、 $A$ の平方根は $VD ½ V -1$ で与えられることがわかる。ただし、 $D ½$ は $D$ の任意の平方根で、それは $D$ の対角成分の任意の平方根を同じ位置の対角成分として持つ対角行列であり、その選び方は $2 n$ 通りある。同じ理由で、上で述べた「半正定値行列の主平方根がただ一つに定まる」ことも言える—半正定値行列^{[注 4]} $A$ の全ての非負固有値の主平方根を対角成分に持つ対角行列を $D ½$ とする行列 $VD ½ V -1$ はただ一つしかない。

適当な冪零行列 $N$ を用いて $I + N$ の形に書ける行列の平方根 $(I + N) ½$ は、二項級数に対する汎函数計算で求められる。同様に、行列の指数函数 $exp$ , 対数函数 $log$ が既知ならば、 $exp(½\cdotlog(A))$ を $A$ の（主）平方根とすることができる（収束性に注意せよ）。

定義

定義 (行列の平方根): 行列 $B$ が行列 $A$ の平方根であるとは、 $B 2 = A$ を満たすときに言う^[1]。^{[注 5]}

定義 (行列の主平方根)

「非負実数が非負の平方根（主平方根）をただ一つだけ持つ」という事実に対応して

命題

半正定値行列は、それ自身が半正定値となるような平方根をただ一つ持つ。
一般に、すべての固有値が正の実数となる複素行列はすべての固有値が正の実数となる平方根をただ一つ持つ。

が成り立つ。そのように定まるただ一つの (the, unique) 平方根は主平方根 (principal square root) と呼ばれる。

主平方根をとる操作は行列全体の成す集合上で連続である^[2]。このとき、考えている行列が実行列ならば、その主平方根もまた実行列になる。主平方根に関する性質は、行列に対する正則汎函数計算（英語版）の帰結として得られる^[3]^[4]。あるいは主平方根の存在と一意性はジョルダン標準形を用いて直截に示せる（後述）。

注意: 記号 $\sqrt •$ や $• 1/2$ は、主平方根を表すために用いる場合^[5]や、平方根の任意の一つを表すために用いる場合などがあるので、文脈に注意すべきである。

計算法

明示公式

$2 \times 2$ 行列の場合は、すべての成分を明示的に計算することによって平方根を求めることはそう難しくない。固有値が退化していない場合の平方根は明示公式（英語版）として記述できる。

すなわち、 ${\textstyle A={\begin{bmatrix}a&b\\c&d\end{bmatrix}}}$ とし、その行列式を ${\textstyle \Delta =ad-bc}$ 、
特性方程式 ${\textstyle (x-a)(x-d)-bc=x^{2}-(a+d)x+ad-bc=0}$ の判別式を
${\textstyle \delta =(a+d)^{2}-4(ad-bc)=(a+d+2{\sqrt {\Delta }})(a+d-2{\sqrt {\Delta }})}$ としたとき、

${\textstyle \delta \neq 0}$ ならば、 ${\textstyle A}$ の平方根は、

${\textstyle {\frac {1}{\sqrt {a+d+2{\sqrt {\Delta }}}}}(A+{\sqrt {\Delta }}I)}$ 、 ${\textstyle {\frac {-1}{\sqrt {a+d+2{\sqrt {\Delta }}}}}(A+{\sqrt {\Delta }}I)}$ 、 ${\textstyle {\frac {1}{\sqrt {a+d-2{\sqrt {\Delta }}}}}(A-{\sqrt {\Delta }}I)}$ 、 ${\textstyle {\frac {-1}{\sqrt {a+d-2{\sqrt {\Delta }}}}}(A-{\sqrt {\Delta }}I)}$ と明示的に表記できる。

平方根となることは、実際に2乗を計算すれば ${\textstyle (A+{\sqrt {\Delta }}I)^{2}=A^{2}+\Delta I+2{\sqrt {\Delta }}A=(a+d+2{\sqrt {\Delta }})A}$ から容易にわかる。

あるいは、2次のケイリー・ハミルトンの定理 ${\textstyle A^{2}-(a+d)A+\Delta I=0}$ から ${\textstyle (a+d)A=A^{2}+\Delta I}$ 、 ${\textstyle (a+d+2{\sqrt {\Delta }})A=A^{2}+2{\sqrt {\Delta }}A+\Delta I=(A+{\sqrt {\Delta }}I)^{2}}$ としても良い。

これら以外に平方根が存在しないことについては、 ${\textstyle B^{2}=A}$ とした場合、 ${\textstyle \delta \neq 0}$ より ${\textstyle A}$ は2つの相異なる固有値 ${\textstyle \lambda _{1}}$ 、 ${\textstyle \lambda _{2}}$ と、独立な固有ベクトル ${\textstyle Av_{1}=\lambda _{1}v_{1}}$ 、 ${\textstyle Av_{2}=\lambda _{2}v_{2}}$ を持つが、任意の2次列ベクトルは、 ${\textstyle v_{1}}$ 、 ${\textstyle v_{2}}$ の1次結合で表せるので、 ${\textstyle Bv_{1}=\alpha _{11}v_{1}+\alpha _{12}v_{2}}$ 、 ${\textstyle Bv_{2}=\alpha _{21}v_{1}+\alpha _{22}v_{2}}$ とすると、 ${\textstyle \lambda _{1}v_{1}=Av_{1}=BBv_{1}=B(\alpha _{11}v_{1}+\alpha _{12}v_{2})=(\alpha _{11}^{2}+\alpha _{12}\alpha _{21})v_{1}+(\alpha _{11}\alpha _{12}+\alpha _{12}\alpha _{22})v_{2}}$ 、 ${\textstyle \lambda _{2}v_{2}=Av_{2}=BBv_{2}=B(\alpha _{21}v_{1}+\alpha _{22}v_{2})=(\alpha _{21}\alpha _{11}+\alpha _{22}\alpha _{21})v_{1}+(\alpha _{21}\alpha _{12}+\alpha _{22}^{2})v_{2}}$ すなわち、 ${\textstyle {\begin{bmatrix}\lambda _{1}&0\\0&\lambda _{2}\end{bmatrix}}={\begin{bmatrix}\alpha _{11}&\alpha _{12}\\\alpha _{21}&\alpha _{22}\end{bmatrix}}{\begin{bmatrix}\alpha _{11}&\alpha _{12}\\\alpha _{21}&\alpha _{22}\end{bmatrix}}={\begin{bmatrix}\alpha _{11}^{2}+\alpha _{12}\alpha _{21}&\alpha _{12}(\alpha _{11}+\alpha _{22})\\\alpha _{21}(\alpha _{11}+\alpha _{22})&\alpha _{22}^{2}+\alpha _{12}\alpha _{21}\end{bmatrix}}}$ であるが、 ${\textstyle \lambda _{1}\neq \lambda _{2}}$ のため、解は ${\textstyle \alpha _{11}=\pm {\sqrt {\lambda _{1}}}}$ 、 ${\textstyle \alpha _{12}=\alpha _{21}=0}$ 、 ${\textstyle \alpha _{22}=\pm {\sqrt {\lambda _{2}}}}$ に定まる。これにより任意の2次列ベクトル ${\textstyle xv_{1}+yv_{2}}$ が ${\textstyle B}$ によりどう変換されるかが定まるが、これは ${\textstyle B}$ が定まることを意味する。 ${\textstyle A}$ が固有値ゼロを持たない場合は解が4組、固有値ゼロを持つ場合（ ${\textstyle \Delta =0}$ の場合）は解が2組であるが、これは上記の明示公式で尽くされているので、これら以外には、平方根は存在しない。

${\textstyle \delta =0}$ の場合は、複雑になる。
${\textstyle \delta =0}$ かつ ${\textstyle A}$ の最小多項式が1次の場合

{\textstyle A=aI}

となるため、次のように無数の平方根を持つ

{\begin{bmatrix}{\sqrt {a-xy}}&x\\y&-{\sqrt {a-xy}}\end{bmatrix}},\quad {\begin{bmatrix}-{\sqrt {a-xy}}&x\\y&{\sqrt {a-xy}}\end{bmatrix}},\quad {\begin{bmatrix}{\sqrt {a}}&0\\0&{\sqrt {a}}\end{bmatrix}},\quad {\begin{bmatrix}-{\sqrt {a}}&0\\0&-{\sqrt {a}}\end{bmatrix}}

${\textstyle \delta =0}$ かつ ${\textstyle A}$ の最小多項式が2次で ${\textstyle \Delta \neq 0}$ の場合

{\textstyle (a+d+2{\sqrt {\Delta }})}

、

{\textstyle (a+d-2{\sqrt {\Delta }})}

のうちどちらかはゼロではなく、ゼロではない方を使って次のように表せる。

{\textstyle {\frac {1}{\sqrt {a+d+2{\sqrt {\Delta }}}}}(A+{\sqrt {\Delta }}I)}

、

{\textstyle {\frac {-1}{\sqrt {a+d+2{\sqrt {\Delta }}}}}(A+{\sqrt {\Delta }}I)}

または

{\textstyle {\frac {1}{\sqrt {a+d-2{\sqrt {\Delta }}}}}(A-{\sqrt {\Delta }}I)}

、

{\textstyle {\frac {-1}{\sqrt {a+d-2{\sqrt {\Delta }}}}}(A-{\sqrt {\Delta }}I)}

平方根が２つしかないことは、次のように言える。

{\textstyle B^{2}=A}

とした場合、

{\textstyle \delta =0}

より

{\textstyle A}

は重根の固有値

{\textstyle \lambda }

を持ち、最小多項式

{\textstyle \varphi (t)=(t-\lambda )^{2}}

が2次のため、

{\textstyle (A-\lambda I)v_{1}=v_{2}\neq 0}

、

{\textstyle (A-\lambda I)v_{2}=(A-\lambda I)^{2}v_{1}=0}

とできるが、任意の2次列ベクトルは、

{\textstyle v_{1}}

、

{\textstyle v_{2}}

の1次結合で表せるので、

{\textstyle Bv_{1}=\alpha _{11}v_{1}+\alpha _{12}v_{2}}

、

{\textstyle Bv_{2}=\alpha _{21}v_{1}+\alpha _{22}v_{2}}

とすると、

{\textstyle \lambda v_{1}+v_{2}=Av_{1}=BBv_{1}=B(\alpha _{11}v_{1}+\alpha _{12}v_{2})=(\alpha _{11}^{2}+\alpha _{12}\alpha _{21})v_{1}+(\alpha _{11}\alpha _{12}+\alpha _{12}\alpha _{22})v_{2}}

、

{\textstyle \lambda v_{2}=Av_{2}=BBv_{2}=B(\alpha _{21}v_{1}+\alpha _{22}v_{2})=(\alpha _{21}\alpha _{11}+\alpha _{22}\alpha _{21})v_{1}+(\alpha _{21}\alpha _{12}+\alpha _{22}^{2})v_{2}}

すなわち、

{\textstyle {\begin{bmatrix}\lambda &1\\0&\lambda \end{bmatrix}}={\begin{bmatrix}\alpha _{11}&\alpha _{12}\\\alpha _{21}&\alpha _{22}\end{bmatrix}}{\begin{bmatrix}\alpha _{11}&\alpha _{12}\\\alpha _{21}&\alpha _{22}\end{bmatrix}}={\begin{bmatrix}\alpha _{11}^{2}+\alpha _{12}\alpha _{21}&\alpha _{12}(\alpha _{11}+\alpha _{22})\\\alpha _{21}(\alpha _{11}+\alpha _{22})&\alpha _{22}^{2}+\alpha _{12}\alpha _{21}\end{bmatrix}}}

であるが、

解は

{\textstyle \alpha _{11}=\pm {\sqrt {\lambda }}}

、

{\textstyle \alpha _{21}=0}

、

{\textstyle \alpha _{12}=1/(2\alpha _{11})}

、

{\textstyle \alpha _{22}=\alpha _{11}}

に定まる。これにより任意の2次列ベクトル

{\textstyle xv_{1}+yv_{2}}

が

{\textstyle B}

によりどう変換されるかが定まるが、これは

{\textstyle B}

が定まることを意味する。解は2組であるが、これは上記の明示公式で尽くされているので、これら以外には、平方根は存在しない。

${\textstyle \delta =0}$ かつ ${\textstyle A}$ の最小多項式が2次で ${\textstyle \Delta =0}$ の場合

この場合、行列は平方根を持たない。

上記と同様の議論で、

{\textstyle B^{2}=A}

とした場合、

{\textstyle \delta =0}

より

{\textstyle A}

は重根の固有値ゼロを持ち、最小多項式

{\textstyle \varphi (t)=t^{2}}

が2次のため、

{\textstyle Av_{1}=v_{2}\neq 0}

、

{\textstyle Av_{2}=A^{2}v_{1}=0}

とできるが、任意の2次列ベクトルは、

{\textstyle v_{1}}

、

{\textstyle v_{2}}

の1次結合で表せるので、

{\textstyle Bv_{1}=\alpha _{11}v_{1}+\alpha _{12}v_{2}}

、

{\textstyle Bv_{2}=\alpha _{21}v_{1}+\alpha _{22}v_{2}}

とすると、

{\textstyle v_{2}=Av_{1}=BBv_{1}=B(\alpha _{11}v_{1}+\alpha _{12}v_{2})=(\alpha _{11}^{2}+\alpha _{12}\alpha _{21})v_{1}+(\alpha _{11}\alpha _{12}+\alpha _{12}\alpha _{22})v_{2}}

、

{\textstyle 0=Av_{2}=BBv_{2}=B(\alpha _{21}v_{1}+\alpha _{22}v_{2})=(\alpha _{21}\alpha _{11}+\alpha _{22}\alpha _{21})v_{1}+(\alpha _{21}\alpha _{12}+\alpha _{22}^{2})v_{2}}

すなわち、

{\textstyle {\begin{bmatrix}0&1\\0&0\end{bmatrix}}={\begin{bmatrix}\alpha _{11}&\alpha _{12}\\\alpha _{21}&\alpha _{22}\end{bmatrix}}{\begin{bmatrix}\alpha _{11}&\alpha _{12}\\\alpha _{21}&\alpha _{22}\end{bmatrix}}={\begin{bmatrix}\alpha _{11}^{2}+\alpha _{12}\alpha _{21}&\alpha _{12}(\alpha _{11}+\alpha _{22})\\\alpha _{21}(\alpha _{11}+\alpha _{22})&\alpha _{22}^{2}+\alpha _{12}\alpha _{21}\end{bmatrix}}}

であるが、

これは解を持たない。

$D$ が $n \times n$ 対角行列ならば、 $D$ の対角成分の任意の平方根を対応する位置の対角成分に持つ対角行列 $R$ を作れば平方根が得られる。 $D$ の対角成分が非負の実数ならば、先の対角行列 $R$ で各成分の符号を全て正としたものは $D$ の主平方根である。

冪等行列の平方根は、自身を平方根に持つ。

対角化の利用

対角化可能行列 $A$ に対し、適当な行列 $V$ と対角行列 $D$ が存在して $A = VDV -1$ と書ける。これは $A$ が $C n$ を張る $n$ 個の固有値を持つことと同値である。このとき $V$ はその列ベクトルが $n$ 個の固有ベクトルであるように選べる。そうして $A$ の平方根は $D$ の任意の平方根を用いて ${\textstyle A^{1/2}=VD^{1/2}V^{-1}}$ と書ける。実際、 ${\textstyle (VD^{1/2}V^{-1})^{2}=VD^{1/2}(V^{-1}V)D^{1/2}V^{-1}=VDV^{-1}=A}$ である。 $A$ がエルミート行列ならば対角化に用いる行列 $V$ は固有ベクトルを適当に選んでユニタリ行列となるようにとれる。この場合、 $V$ の逆行列はたんに随伴をとるだけであるから、 ${\textstyle A^{1/2}=VD^{1/2}V^{\dagger }}$ と書ける。

ジョルダン分解の利用

正方行列 $A$ のジョルダン標準形を $J=P^{-1}AP$ とすると、次が言える。

K

を

J

の平方根

K^{2}=J

とすると、

B=PKP^{-1}

は、

B^{2}=(PKP^{-1})(PKP^{-1})=PK^{2}P^{-1}=PJP^{-1}=A

より、

A

の平方根となる。

逆に

B

を

A

の平方根

B^{2}=A

とすると、

K=P^{-1}BP

は、

K^{2}=(P^{-1}BP)(P^{-1}BP)=P^{-1}B^{2}P=P^{-1}AP=J

より、

J

の平方根であり、

B=PKP^{-1}

である。

このため、ジョルダン標準形 $J=P^{-1}AP$ の全ての平方根 $K$ を知ることができれば、 $B=PKP^{-1}$ により、 $A$ の全ての平方根 $B$ を知ることができる。

$J={\begin{bmatrix}J_{1}&\cdots &0\\\vdots &\ddots &\vdots \\0&\cdots &J_{m}\\\end{bmatrix}}$ とし、 $K_{i}^{2}=J_{i},1\leq i\leq m$ とすれば、 $K={\begin{bmatrix}K_{1}&\cdots &0\\\vdots &\ddots &\vdots \\0&\cdots &K_{m}\\\end{bmatrix}}$ は、 $J$ の平方根のうちの一つである。

逆に、 $J={\begin{bmatrix}J_{1}&O\\O&J_{2}\\\end{bmatrix}}$ 、ただし $J_{1},J_{2}$ はジョルダン標準形で、 $J_{1}$ と $J_{2}$ は共通の固有値を持たないとすると、 $J$ の平方根は、 $K={\begin{bmatrix}K_{1}&O\\O&K_{2}\\\end{bmatrix}}$ ただし、 $K_{1}^{2}=J_{1},K_{2}^{2}=J_{2}$ に限られる。

これは、 $K={\begin{bmatrix}K_{1}&B\\C&K_{2}\\\end{bmatrix}},J=K^{2}$ とすると、

K^{3}=KJ={\begin{bmatrix}K_{1}&B\\C&K_{2}\\\end{bmatrix}}{\begin{bmatrix}J_{1}&O\\O&J_{2}\\\end{bmatrix}}={\begin{bmatrix}K_{1}J_{1}&BJ_{2}\\CJ_{1}&K_{2}J_{2}\\\end{bmatrix}}=JK={\begin{bmatrix}J_{1}&O\\O&J_{2}\\\end{bmatrix}}{\begin{bmatrix}K_{1}&B\\C&K_{2}\\\end{bmatrix}}={\begin{bmatrix}J_{1}K_{1}&J_{1}B\\J_{2}C&J_{2}K_{2}\\\end{bmatrix}}

より

$BJ_{2}=J_{1}B$ となるが、 $B={\begin{bmatrix}b_{1}&\dots &b_{k}\\\end{bmatrix}}$ 、 $J_{2}$ の対角成分（固有値）を $\lambda _{i},1\leq i\leq k$ と置き、第１列に注目すれば、 $\lambda _{1}b_{1}=J_{1}b_{1}$ だが、 $J_{1}$ と $J_{2}$ は共通の固有値を持たないため、 $b_{1}=0$ が言え、順次、第２列、第３列に注目すれば $b_{i}=0$ が言え、 $B=O$ が言える。

$CJ_{1}=J_{2}C$ からも同様に、 $C={\begin{bmatrix}c_{1}\\\vdots \\c_{k}\\\end{bmatrix}}$ と置き、第k行に注目すれば $c_{k}J_{1}=\lambda _{k}c_{k}$ だが、 $J_{1}$ と $J_{2}$ は共通の固有値を持たないため、 $c_{k}=0$ が言え、順次、第k-1行、第k-2行に注目すれば $c_{i}=0$ が言え、 $C=O$ が言える。このため、上記が言える。

ジョルダン標準形の平方根には、ジョルダン細胞の平方根であるものと、

{\begin{bmatrix}1&0\\0&1\\\end{bmatrix}}={\begin{bmatrix}{\sqrt {1-bc}}&b\\c&-{\sqrt {1-bc}}\\\end{bmatrix}}^{2}

のようにジョルダン細胞の平方根ではないもの（同じ固有値のジョルダン細胞が複数あるときに発生する）があるので、注意が必要である。

ジョルダン細胞の平方根

ジョルダン細胞 $J_{n}(\lambda )$ とは $n$ 次正方行列で、 $j<i$ のとき $J_{n}(\lambda )_{ij}=0$ 、 $J_{n}(\lambda )_{ii}=\lambda$ 、 $J_{n}(\lambda )_{ii+1}=1$ 、 $j>i+1$ のとき $J_{n}(\lambda )_{ij}=0$ となるものを言う。

$\lambda \neq 0$ のとき、ジョルダン細胞 $J_{n}(\lambda )$ の平方根は、下記の行列 $K$ および $-K$ である。

j<i

のとき

K_{ij}=0

、

K_{ii}={\sqrt {\lambda }}

、

j>i

のとき

K_{ij}={\frac {(-1)^{j-i-1}(2j-2i-2)!}{2^{2j-2i-1}(j-i-1)!}}\lambda ^{-(2j-2i-1)/2}

$\lambda =0$ のとき、ジョルダン細胞 $J_{n}(0)$ は、

n=1

の場合、平方根0を持つ

n>1

の場合、平方根を持たない

例 $J_{2}(0)={\begin{bmatrix}0&1\\0&0\\\end{bmatrix}}$ は平方根を持たない。

$\lambda \neq 0$ のとき、ジョルダン細胞 $J_{n}(\lambda )$ の平方根が２つしかないことは、次から言える。 $K^{2}=J_{n}(\lambda )$ となる行列が存在したとし、 $K^{3}$ の成分を考える。

K_{ij}^{3}=(J_{n}(\lambda )K)_{ij}={\begin{cases}\lambda K_{i1}+K_{i+1j}&(1\leq i\leq n-1)\\\lambda K_{nj}&(i=n)\end{cases}}

K_{ij}^{3}=(KJ_{n}(\lambda ))_{ij}={\begin{cases}\lambda K_{i1}&(j=1)\\\lambda K_{ij}+K_{ij-1}&(2\leq j\leq n)\end{cases}}

$K_{nj}^{3},2\leq j\leq n$ を比較すると、 $\lambda K_{nj}=\lambda K_{nj}+K_{nj-1},2\leq j\leq n$ このため $K_{nj}=0,1\leq j\leq n-1$

$K_{ij}^{3},1\leq i\leq n-1,2\leq j\leq n$ を比較すると、 $\lambda K_{ij}+K_{i+1j}=\lambda K_{ij}+K_{ij-1},1\leq i\leq n-1,2\leq j\leq n$ このため $K_{i+1j+1}=K_{ij},1\leq i\leq n-1,1\leq j\leq n-1$

このため、 $K$ は上三角行列で、斜めに同じ値が並ばなければならない。 $K^{2}=J_{n}(\lambda )$ の $(n,n)$ 成分を比較することにより、 $K_{nn}^{2}=\lambda ,K_{nn}=\pm {\sqrt {\lambda }}$ が言え、以下 $(j,n)$ 成分 $j=n-1,n-2,\dots ,1$ を比較することにより、 $K$ の全ての成分が順番に１次方程式で定まるため、平方根が２つしかないことが言える。

英語版からの直訳

対角化可能でない行列の場合にはジョルダン標準形が利用できる。^{[注 6]}

すべての固有値が正の実数であるような任意の複素行列が、同じ条件の平方根を持つことを見るには、ジョルダンブロックの場合に証明すれば十分である。そのようなブロックは実数 $λ > 0$ および冪零行列 $N$ を用いて $λ (I + N)$ の形に書ける。平方根の二項級数展開 $(1 + z) 1/2 = 1 + a 1 z + a 2 z 2 + \dots$ （収束域は $| z | < 1$ ）に対し、形式冪級数としての平方は $1 + z$ に等しい。 $z$ を $N$ に置き換えれば、冪零性により有限個を除く全ての項は零となり、 $S = \sqrt λ (I + a 1 N + a 2 N 2 + \dots)$ が固有値 $\sqrt λ$ に属するジョルダンブロックの平方根を与える。

一意性を見るには $λ = 1$ の場合に確認すれば十分である。上で構成した平方根を $S = I + L$ の形に書けば、 $L$ は定数項を持たない $N$ の多項式である。固有値が正の実数となる他の任意の平方根 $T$ は $T = I + M$ の形で $M$ が冪零かつ $N$ と（したがって $L$ と）可換となるようにとれる。しかしこのとき $0 = S 2 - T 2 = 2(L - M)(I + (L + M)/2)$ であり、また $L$ と $M$ の可換性により $L + M$ は冪零ゆえ $I + (L + M)/2$ は可逆（逆行列はノイマン級数で与えられる）となるから、したがって $L = M$ .

すべての固有値が正の実数であるような行列 $A$ の最小多項式を $p (t)$ とするとき、 $A$ の一般固有空間へのジョルダン分解は $p (t) -1$ の部分分数分解から導かれる。すなわち、対応する一般固有空間の上への射影は $A$ の実係数多項式として与えられ、各固有空間上で $A$ は上記の通り $λ (I + N)$ の形をしている。固有空間上での平方根の冪級数展開は、 $A$ の主平方根が実係数多項式 $q (t)$ に対する $q (A)$ の形をしていることを示すものである。

現実的な計算法

「対角化」の方法でも「ジョルダン分解」の方法でも、すべての固有値を算出することが必要となるが、それは行列の特性方程式（あるいは最小方程式）のすべての解を求めることと同じであり、行列の次数が大きくなれば非現実的となる。このため、現実的な平方根の求め方が必要となる。

行列対数関数、行列指数関数による求め方

実数 $a>0$ の平方根 ${\sqrt {a}}$ が $\exp \left({\frac {1}{2}}\log(a)\right)$ で求まることと同様に、

n次実数値正方行列 $A$ の全ての特性根の実数部分が正である場合、

行列対数関数を $\log(A)=\log(c)I-\Sigma _{k=1}^{\infty }{\frac {1}{k}}\left(I-{\frac {1}{c}}A\right)^{k}$ と定義し（cは任意の正数、級数が収束すれば $c$ に係らず同じ値に収束する）

行列指数関数を $\exp(X)=\Sigma _{k=0}^{\infty }{\frac {1}{k!}}X^{k}$ と定義すれば（ $X$ はn次実数値正方行列）、

2乗すると $A$ となり、かつ全ての特性根の実数部分が正となる行列 ${\sqrt {A}}$ は、

${\sqrt {A}}=\exp \left({\frac {1}{2}}\log(A)\right)$ により計算でき、かつこの行列に一意に定まる。

この方法は、固有値を全て求める必要がないこと（「全ての特性根の実数部分が正」という条件は、特性根を全て求めなくても、十分条件がいくつか知られている）、収束計算が速いこと、対称行列に限らず一般の行列に利用可能であることなど、現実的かつ速い計算方法になっている。

また、行列の平方根に限らず、ｎ乗根も同様に計算することができる。

ニュートン法

実数の方程式 ${\textstyle f(x)=x^{2}-a=0}$ をニュートン法で解く方法を、行列にそのまま適用して求める方法である。

ｎ次正方行列 ${\textstyle A}$ に対し、ｎ次正方行列の列 ${\textstyle X_{m}}$ を次の漸化式で定める

${\textstyle X_{m+1}={\frac {1}{2}}(X_{m}+AX_{m}^{-1})}$

この列が適当な初期値 $X_{0}$ について収束すれば、収束値 ${\textstyle X_{\infty }}$ について、 ${\textstyle X_{\infty }^{2}=A}$ となる。

このことは、収束すれば ${\textstyle X_{\infty }={\frac {1}{2}}(X_{\infty }+AX_{\infty }^{-1})}$ が成り立つことから言える。

対称行列（エルミート行列）に限定した議論

以下では、対称行列（あるいはエルミート行列）に限定した行列の平方根についての性質を示す。「正定値行列」とは、対称行列（あるいはエルミート行列）で、その全ての固有値が正の実数であるものをいう。「半正定値行列」とは、対称行列（あるいはエルミート行列）で、その全ての固有値がゼロまたは正の実数であるものをいう。

定義

転置あるいはエルミート共軛を用いれば、より一般に非対称あるいは非エルミートな矩形行列の範疇で「平方根」をとることができる。

定義: 半正定値実正方行列 $A$ に対して、 $A = B t B$ （あるいは $A = t BB$ 、すなわち $A$ はグラム行列）を満たす任意の矩形行列 $B$ を $A$ の非対称平方根 (asymmetric square root)^[6] と呼ぶ。（記号 $t$ は行列の転置を表す）
定義: 半正定値複素正方行列 $A$ に対して、 $A = BB *$ （あるいは $A = B * B$ ）を満たす任意の矩形行列 $B$ を $A$ の非エルミート平方根 (non-Hermitian square root) と呼ぶ。（記号 $*$ はエルミート共軛を表す）

$B$ がエルミート（実係数の場合は対称）ならば、 $B$ は上で述べた $A$ の平方根と一致する。任意の正定値エルミート行列 $A$ に対し、それ自身正定値エルミートとなる平方根は一意であり、これを主平方根 (unique square root, principal square root)^[7]と呼ぶ。

注: コレスキー分解からも平方根の例が得られるが、コレスキー因子と（主）平方根とを混同してはならない。

非対称平方根のユニタリ自由度

正実数の平方根は、主平方根に $\pm1$ を掛けたものですべて与えられた。これに対応するように、正定値エルミート行列の任意の非エルミート平方根は、ユニタリ変換によって関連付けられる^[8]:

主張: 半正定値行列 $T$ に対し、 $T = A*A = B*B$ ならばユニタリ行列 $U$ が存在して $A = UB$ と書ける。

実際、主平方根を $B ≔ T ½$ と書けば、 $T$ が正定値のとき $B$ は可逆で、 $U = AB -1$ がユニタリであることは ${\begin{aligned}U^{*}U&=\left((B^{*})^{-1}A^{*}\right)\left(AB^{-1}\right)=(B^{*})^{-1}T(B^{-1})\\&=(B^{*})^{-1}B^{*}B(B^{-1})=I.\end{aligned}}$ からわかる。 $T$ が正定値でない半正定値行列のときは逆行列の代わりにムーア・ペンローズ擬逆行列 $B +$ が取れて、作用素 $B + A$ は部分等長だから、 $T$ の核の上で自明となるように拡張して $U$ が得られる。

応用

平方根およびそのユニタリ自由度は線型代数学および函数解析学の全般に応用を持つ。

極分解

→詳細は「極分解（英語版）」を参照

可逆行列 $A$ に対して、ユニタリ行列 $U$ および正定値行列 $P$ が一意に存在して $A = UP$ と書ける。これを $A$ の極分解と呼ぶ。この正定値行列 $P$ は正定値行列 $A*A$ の主平方根であり、 $U$ は $U = AP -1$ で求まる。

$A$ が可逆でないときでも、適当な方法で $P$ が定まれば（それは一意であり）極分解が定義される。極分解におけるユニタリ作用素 $U$ は一意ではないが、以下のようにして「自然な」ユニタリ行列は求められる: $AP +$ は $A$ の値域からそれ自身への作用素であり、これは $A*$ の核上自明に延長してユニタリ作用素 $U$ にできるから、この $U$ を極分解に用いればよい。

一般化

有限次元数空間上で行列を考える代わりに、任意のヒルベルト空間上の有界作用素に対して、その平方根を考えることができる。とくに有界半正定値作用素に対して、半正定値な平方根としての主平方根は一意に決まる。あるいは非エルミート平方根に関しても同様に考えることができる。無限次元の場合には、平方根がユニタリ作用素を施す違いを除いて決まるという事実は、作用素が閉値域ならば正しい。非有界作用素に対しては、閉かつ稠密に定義された二つの平方根 $A, B$ に対し部分等方な $U$ で $A = UB$ とできることなどは言える。

脚注

[脚注の使い方]

注釈

^ 例えば ${\textstyle {\begin{bmatrix}0&1\\0&0\end{bmatrix}}}$
^ たとえば、行列 ${\textstyle {\begin{bmatrix}33&24\\48&57\end{bmatrix}}}$ は行列 ${\textstyle {\begin{bmatrix}1&4\\8&5\end{bmatrix}},{\begin{bmatrix}5&2\\4&7\end{bmatrix}}}$ およびこれらの符号を変えたものを平方根に持つ
^ これはふつう、対称あるいはエルミートで考える
^ 正定値行列となるための必要十分条件はそのすべての固有値が正となることであった
^ このとき、平方が定義できるために行列は必然的に正方行列でなければならないことに注意せよ。とくに対称行列の場合が重要である。
^ 行列の対数函数#非対角化可能行列の対数の項と同様の級数展開を用いる方法

出典

参考文献

Bourbaki, Nicolas (2007), Théories spectrales, chapitres 1 et 2, Springer, ISBN 3540353313
Conway, John B. (1990), A Course in Functional Analysis, Graduate Texts in Mathematics, 96, Springer, pp. 199–205, ISBN 0387972455 , Chapter IV, Reisz functional calculus
Cheng, Sheung Hun; Higham, Nicholas J.; Kenney, Charles S.; Laub, Alan J. (2001), “Approximating the Logarithm of a Matrix to Specified Accuracy”, SIAM Journal on Matrix Analysis and Applications 22 (4): 1112–1125, doi:10.1137/S0895479899364015, オリジナルの2011-08-09時点におけるアーカイブ。
Burleson, Donald R., Computing the square root of a Markov matrix: eigenvalues and the Taylor series
Denman, Eugene D.; Beavers, Alex N. (1976), “The matrix sign function and computations in systems”, Applied Mathematics and Computation 2 (1): 63–94, doi:10.1016/0096-3003(76)90020-5
Higham, Nicholas (2008), Functions of Matrices. Theory and Computation, SIAM, ISBN 978-0-89871-646-7
Horn, Roger A.; Johnson, Charles R. (1994), Topics in Matrix Analysis, Cambridge University Press, ISBN 0521467136
Rudin, Walter (1991), Functional analysis, International series in pure and applied mathematics (2nd ed.), McGraw-Hill, ISBN 0070542368

[1] 例えば ${\textstyle {\begin{bmatrix}0&1\\0&0\end{bmatrix}}}$

[2] たとえば、行列 ${\textstyle {\begin{bmatrix}33&24\\48&57\end{bmatrix}}}$ は行列 ${\textstyle {\begin{bmatrix}1&4\\8&5\end{bmatrix}},{\begin{bmatrix}5&2\\4&7\end{bmatrix}}}$ およびこれらの符号を変えたものを平方根に持つ

[3] これはふつう、対称あるいはエルミートで考える

[4] 正定値行列となるための必要十分条件はそのすべての固有値が正となることであった

[6] このとき、平方が定義できるために行列は必然的に正方行列でなければならないことに注意せよ。とくに対称行列の場合が重要である。

[11] 行列の対数函数#非対角化可能行列の対数の項と同様の級数展開を用いる方法

[Higham-5] Higham, Nicholas J. (April 1986), “Newton's Method for the Matrix Square Root”, Mathematics of Computation 46 (174): 537–549, doi:10.2307/2007992, JSTOR 2007992

[7] Horn, Roger A.; Johnson, Charles R. (1990). Matrix analysis. Cambridge: Cambridge Univ. Press. p. 411. ISBN 9780521386326

[8] 行列変数の解析函数について: Higham 2008, Horn & Johnson 1994

[9] 正則汎函数計算について: Rudin 1991, Bourbaki 2007, Conway 1990

[10] Gentle, James E., Matrix Algebra, p. 125

[12] Marshall, Albert W.; Olkin, Ingram; Arnold, Barry, Inequalities, p. 773

[13] Higham, Nicholas J., Functions of Matrices, p. 20

[14] Lu, Andreas, Practical Optimization, p. 601

[注 1]

[注 2]

[注 3]

[注 4]

[1]

[注 5]

[2]

[3]

[4]

[5]

[注 6]

[6]

[7]

[8]

定義

計算法

明示公式

対角化の利用

ジョルダン分解の利用

ジョルダン細胞の平方根

英語版からの直訳

現実的な計算法

行列対数関数、行列指数関数による求め方

ニュートン法

対称行列（エルミート行列）に限定した議論

定義

非対称平方根のユニタリ自由度

応用

極分解

一般化

関連項目

脚注

注釈

出典

参考文献