🔗一般のベクトル空間の線形変換に関しての固有値の議論について
三角行列の固有値 #
行列式の基本的性質より、三角行列の行列式は対角成分の積に等しくなる。
そのことから、三角行列の固有値は対角成分であることがわかる。
証明 #
線形変換\(f: V \to V\)の表現行列の正方行列\(A_{f}\)が三角行列であるとき、固有多項式 $$ \phi_{A_{f}}(t)= | A_{f} - t E | $$ の\( A_{f} - t E \)も三角行列なので、 $$ \phi_{A_{f}}(t)= | A_{f} - t E | = (a_{11} - t )(a_{22} -t) \dots (a_{nn} -t) $$ と表すことができる。
行列式の次数下げというテクニックを繰り返し適用することによって対角成分のみが残るので。
🔗行列式の次数下げの計算 (KIT(金沢工業大学)数学ナビゲーション)
このことから、三角行列の固有値は対角成分であることがわかる。
固有値と固有ベクトルから導き出される関係 #
後の対角化の理解のために必要な定理を先に扱っておく。
\(A\)を\(n\)次正方行列として、\(\lambda_{1}, \space \dots ,\space \lambda_{n}\)を\(A\)の固有値(相異なるとは限らない)、\(\bm{x}_{i}\)を固有値\(\lambda_{i}\)に属する固有ベクトルとする。
\(\bm{x}_{i}\)を列ベクトルとして行列 $$ Q = (\bm{x}_{1}, \space \dots, \space \bm{x}_{n}) $$ を得る。
このとき、 $$ AQ= Q \begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix} $$ が成り立つ。
そして、逆に、列にゼロベクトルを含まない\(n\)次正方行列\(Q\)が存在して $$ AQ= Q \begin{pmatrix} d_{1} & &O \\ & \ddots & \\ O & & d_{n} \end{pmatrix} $$ を満たすとき、\(d_{i}\)は\(A\)の固有値で、\(Q\)の第\(i\)列の列ベクトルは\(d_{i}\)に属する固有ベクトルである。
固有値に重複がないときは、🔗固有ベクトルの一次独立性より\(Q\)は正則行列になる。
証明 #
仮定より\(A\bm{x}_{i} = \lambda \bm{x}_{i}\)である。
この関係を\(\bm{x}_{i}\)を列ベクトルとして、まとめて行列で表して変形すると、
$$ A(\bm{x}_{1}, \space \dots, \space \bm{x}_{n})=(A\bm{x}_{1}, \space \dots, \space A \bm{x}_{n}) \\ = (\lambda_{1}\bm{x}_{1}, \space \dots, \space \lambda_{n} \bm{x}_{n}) \\ = (\bm{x}_{1}, \space \dots, \space \bm{x}_{n} ) \begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix} $$
したがって、
$$
A(\bm{x}_{1}, \space \dots, \space \bm{x}_{n}) = (\bm{x}_{1}, \space \dots, \space \bm{x}_{n}) \begin{pmatrix}
\lambda_{1} & &O \\
& \ddots & \\
O & & \lambda_{n}
\end{pmatrix}
$$
であり、\(Q = (\bm{x}_{1}, \space \dots, \space \bm{x}_{n})\)だったので、
$$
AQ = Q\begin{pmatrix}
\lambda_{1} & &O \\
& \ddots & \\
O & & \lambda_{n}
\end{pmatrix}
$$
が示される。
逆の証明 #
先程の証明の議論を逆に辿れば証明できる。
\(Q\)を列にゼロベクトルを含まない\(n\)次正方行列とする。
Qが $$ AQ = Q \begin{pmatrix} d_{1} & &O \\ & \ddots & \\ O & & d_{n} \end{pmatrix} $$ を満たすとき、\(Q\)の第\(i\)列を\(\bm{x}_{i}\)とすると、上の等式の両辺の行列の第\(i\)列をそれぞれ比較することにより、 $$ A\bm{x}_{i} = d_{i}\bm{x}_{i} $$ という関係を得る。
仮定より、\(\bm{x}_{i} \neq \bm{0}\)なので、\(d_{i}\)は\(A\)の固有値で\(\bm{x}_{i}\)は\(d_{i}\)に属する固有ベクトルである。
対角行列と固有値、固有ベクトルの関係、対角化 #
正方行列\(A\)について、\(B=P^{-1}AP\)が対角行列になるような正則行列\(P\)と対角行列\(B\)を求めることを\(A\)の対角化という。
そのような\(P, \space B\)が存在するとき、\(A\)は対角化可能という。
対角化について、以下の定理が成り立つ。
\(n\)次正方行列\(A\)が\(n\)個の相異なる固有値\(\lambda_1, \space \dots, \space \lambda_n \)をもつとき、\(A\)はこれらの固有値を対角成分にもつ対角行列に対角化可能である。
証明 #
\(A\)の固有値\(\lambda_{1}, \space \dots ,\lambda_{n}\)に属する固有ベクトルを\(\bm{x}_{1}, \space \dots ,\bm{x}_{n}\)とする。
このとき、🔗固有ベクトルの一次独立性より\(\bm{x}_{1}, \space \dots ,\bm{x}_{n}\)は一次独立である。
よって、\(\bm{x}_{i}\)を第\(i\)列にもつ正方行列\(P\)を考えると、\(P\)は正則行列である。
そこで上述の定理より、 $$ AP= P\begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix} $$ を得て、\(P^{-1}\)を両辺に左からかければ $$ P^{-1}AP= \begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix} $$ となる。
対角化の意味 #
対角化の意味(?)を整理しておく。
$$ P^{-1}AP= \begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix} $$ と対角化される行列\(A\)について、相似な行列とは\(P^{-1}AP=B\)の関係にある行列\(A,\space B\)のことだったので、行列\(A\)と右辺の行列\(\begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix}\)は相似な行列であることがわかる。
そこで、🔗相似な行列の固有多項式、固有値は一致することと、🔗三角行列の固有値が対角成分で定まることより、 行列\(A\)の固有値と対角行列\(\begin{pmatrix} \lambda_{1} & &O \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix}\)の固有値は一致するので、どちらの行列の固有値も\(\lambda_{1}, \space \dots, \space \lambda_{n}\)となることがわかる。
\(n\)次正方行列が相異なる\(n\)個の固有値をもたない場合で対角化可能な例 #
正方行列 $$ A = \begin{pmatrix} 7 & 0 \\ 0 & 7 \end{pmatrix} $$ を考える。
\(A\)の固有値\(\lambda\)は
$$
\left| \begin{matrix} 7 - t & 0 \\
0 & 7 - t
\end{matrix}
\right|=
(7-t)(7-t) =0
$$
なので、\(t=7\)つまり、\(\lambda = 7\)である。
ついでに、代数的重複度は\(2\)である。
固有空間を求めると、 $$ \begin{pmatrix} 7 - 7 & 0 \\ 0 & 7 - 7 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} =\bm{0} $$ となるので固有空間\(V(7)\)は\(V\)を\(A\)に対応する線形写像の定義域を数ベクトル空間\(V\)とすると(\(f_A: V \to V\)) $$ V(7) = \{ \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \in V \} $$ である。 つまり、\(V(7)\)は\(V\)のベクトル全体からなることがわかる。
ここで大事なのが、\(V(7)\)の次元\(\dim V(7)\)は、\(V\)の任意の元は、例えば基底
$$
\begin{pmatrix} 1 \\
0
\end{pmatrix}, \space \begin{pmatrix} 0 \\
1
\end{pmatrix}
$$
を用いて
$$
\forall \begin{pmatrix} x_1 \\ x_2
\end{pmatrix} \in V, \space \begin{pmatrix} x_1 \\ x_2
\end{pmatrix} = x_1 \begin{pmatrix} 1 \\
0
\end{pmatrix}+ x_2 \begin{pmatrix} 0 \\ 1
\end{pmatrix}
$$
と一次結合で表すことができる。
よって、\(\dim V(7)=2\)である。
固有値\(\lambda=7\)の代数的重複度は\(2\)で幾何的重複度も\(2\)であることが分かる。
$$ A = \begin{pmatrix} 7 & 0 \\ 0 & 7 \end{pmatrix} $$ は既に対角行列だが、 $$ E^{-1}AE = E \begin{pmatrix} 7 & 0 \\ 0 & 7 \end{pmatrix} E = \begin{pmatrix} 7 & 0 \\ 0 & 7 \end{pmatrix} $$ となり、\(E\)は正則行列なので、確かに対角化が可能であることがわかる。
この一例によって、\(n\)個の固有値が相異ならない場合でも対角化できる場合があることがわかる。
固有値の代数的重複度と幾何的重複度(固有空間の次元)の関係 #
固有値の🔗代数的重複度と🔗幾何的重複度の間には重要な関係がある。
\(n\)次正方行列\(A\)の固有値の一つを\(\lambda\)として、\(\lambda\)に属する固有空間を\(V(\lambda)\)とする。
\(j=\dim V(\lambda) = \lambdaの幾何的重複度\)、\(k = \lambdaの代数的重複度\)とすると、 $$ j \leqq k $$ という関係が成り立つ。
証明 #
$$
(A - \lambda E)\bm{x}=\bm{0}
$$
の基本解(\((A - \lambda E)\)の核空間の基底)を\(\bm{x}_{1}, \space \dots, \space \bm{x}_{j}\)とする。
これらは\(\lambda\)に属する固有ベクトルである。
このベクトルの組に、\(V\)の\(n-j\)個のベクトルを足して、\(V\)の基底 $$ \bm{x}_{1}, \space \dots, \space \bm{x}_{j}, \space \bm{x}_{j+1}, \space \dots, \space \bm{x}_{n} $$ を得ることができる。(基底の延長定理)
これらのベクトルを列ベクトルとする、\(n\)次正方行列 $$ P = (\bm{x}_{1}, \space \dots, \space \bm{x}_{j}, \space \bm{x}_{j+1}, \space \dots, \space \bm{x}_{n}) $$ を考えると、\(P\)は正則である。
そして、 $$ AP = A(\bm{x}_{1}, \space \dots, \space \bm{x}_{j}, \space \bm{x}_{j+1}, \space \dots, \space \bm{x}_{n}) \\ = (A\bm{x}_{1}, \space \dots, \space A\bm{x}_{j}, \space A\bm{x}_{j+1}, \space \dots, \space A\bm{x}_{n}) \\ = (\lambda \bm{x}_{1}, \space \dots, \space \lambda \bm{x}_{j}, \space A\bm{x}_{j+1}, \space \dots, \space A\bm{x}_{n}) $$ であり、\(A\bm{x}_{j+1}, \space \dots, \space A\bm{x}_{n}\)は\(P\)の列ベクトルの1次結合で表されるので、更に $$ = (\bm{x}_{1}, \space \dots, \space \bm{x}_{j}, \space \bm{x}_{j+1}, \space \dots, \space \bm{x}_{n})\begin{pmatrix} \begin{matrix} \lambda & & O\\ & \ddots & \\ O & & \lambda \\ \end{matrix} & \begin{matrix} & & \\ & X & \\ & & \end{matrix} \\ \begin{matrix} & & \\ & O & \\ & & \end{matrix} & \begin{matrix} & & \\ & Y & \\ & & \end{matrix} \end{pmatrix} \\ = P \begin{pmatrix} \begin{matrix} \lambda & & O\\ & \ddots & \\ O & & \lambda \\ \end{matrix} & \begin{matrix} & & \\ & X & \\ & & \end{matrix} \\ \begin{matrix} & & \\ & O & \\ & & \end{matrix} & \begin{matrix} & & \\ & Y & \\ & & \end{matrix} \end{pmatrix} $$ と変形できる。(左上の対角行列になっているブロック行列は\(j \times j\)行列である)
具体的なブロック行列\(X, \space Y\)の値を知らずとも、とにかくこのような形に表すことができるというわけだ。
\(P\)は正則行列なので、逆行列\(P^{-1}\)を両辺に左からかけて、 $$ P^{-1} A P = \begin{pmatrix} \begin{matrix} \lambda & & O\\ & \ddots & \\ O & & \lambda \\ \end{matrix} & \begin{matrix} & & \\ & X & \\ & & \end{matrix} \\ \begin{matrix} & & \\ & O & \\ & & \end{matrix} & \begin{matrix} & & \\ & Y & \\ & & \end{matrix} \end{pmatrix} $$
🔗相似な行列の固有多項式、固有値は一致することと、🔗三角行列の固有値が対角成分で定まることより、 $$ \phi_{P^{-1}AP}(t)=\phi_{A}(t)=(\lambda - t)^{j} \left| Y - tE_{n-j \times n-j} \right| $$ である。
\(\lambda\)は\(\phi_{A}(t)\)の\(k\)重解なので、\(j \leqq k\)である。
(上式の\((\lambda - t)^{j}\)に着目して、\(j\)が\(k < j\)になると、\(\lambda\)の代数的重複度が\(k\)であることに反する。)
固有空間の次元の和 #
🔗固有値の代数的重複度と幾何的重複度(固有空間の次元)の関係から以下のことが示される。
\(n\)次正方行列\(A\)の相異なる固有値\(\lambda_1, \space \dots, \space \lambda_k\)について、\(\lambda_i\)に属する固有空間を\(V(\lambda_i)\)とする。
このとき、 $$ \sum_{i=1}^{k} \dim V(\lambda_i) \leqq n $$ が成り立つ。
証明 #
\(\lambda_i\)の代数的重複度を\(j\)とすると、固有多項式が\(n\)次なので、 $$ \sum_{i=1}^{k} j_i \leqq n $$ である。
そして、先程の🔗固有値の代数的重複度と幾何的重複度(固有空間の次元)の関係より、 $$ \dim V(\lambda_i) \leqq j_i $$ なので、 $$ \sum_{i=1}^{k} \dim V(\lambda_i) \leqq \sum_{i=1}^{k} j_i \leqq n $$ となる。
対角化の主定理 #
\(n\)次正方行列\(A\)が相異なる\(n\)個の固有値をもつとき、\(A\)は🔗対角化可能である。
しかし、相異なる\(n\)個の固有値を持たない場合でも対角化が可能な場合がある。
一般に対角化できるのはどのようなときだろうか。
\(n\)次正方行列\(A\)について、以下の条件はすべて同値である。
-
\(A\)は対角化可能である。
-
\(A\)の固有方程式\(\phi_{A}(t)\)は重複を含めて\(n\)個の解をもち、各固有値の幾何的重複度(固有空間の次元)はその固有値の代数的重複度と一致する。
つまり、\(A\)の異なる固有値を\(\lambda_1, \space \dots, \space \lambda_s\)として、\(\lambda_i\)の代数的重複度を \(d_i\)、\(\lambda_i\)に属する固有空間を\(V(\lambda_i)\)とすると、 $$ \sum_{i=1}^{s} d_i = n, \quad d_i = \dim V(\lambda_i) \space(i=1, \space \dots, \space s) $$ である。 -
\(A\)の各固有値に属する固有空間の次元の和は\(n\)である。
$$ \sum_{i=1}^{s} \dim V(\lambda_i) = n $$ -
\(n\)個の\(A\)の一次独立な固有ベクトルが存在する。
証明 #
\(1 \implies 2 \implies 3 \implies 4 \implies 1\)を証明して、 $$ 1 \iff 2 \iff 3 \iff 4 $$ であることを示す。
\(1 \implies 2\)の証明 #
仮定より、\(A\)は対角化可能なので、ある正則行列\(P\)が存在して、
$$
P^{-1}AP = \begin{pmatrix} \lambda_1 & & O \\
& \ddots & \\
O & & \lambda_n
\end{pmatrix}
$$
と表せる。
固有値は相異なると仮定していないことに注意: 🔗#n次正方行列が相異なるn個の固有値をもたない場合で対角化可能な例
\(\lambda_1, \space \dots, \space \lambda_n\)は\(P^{-1}AP\)の固有値であり、 🔗相似な行列の固有多項式、固有値は一致するので、\(A\)の固有値でもある。
\(P\)の列行列を適当に入れ替えることで、右側の対角成分の位置を入れ替えることができるので、調整した正則行列を新たに\(P\)として、 $$ P^{-1}AP= \begin{pmatrix} \lambda_1 & & & & & & \\ & \ddots & & & & & \\ & & \lambda_1 & & & & \\ & & & \ddots & & & \\ & & & & \lambda_s & & \\ & & & & & \ddots & \\ & & & & & & \lambda_s \\ \end{pmatrix} \\ = diag(\lambda_1, \space \dots, \space \lambda_1, \space \dots, \lambda_s, \space \dots, \space \lambda_s) $$ と対角化することができる。
なぜ列ベクトルを入れ替えることによって対角成分の位置を入れ替えることができるのか分からない場合は、そもそもどのようにして
$$ P^{-1}AP=diag(\lambda_1, \space \dots, \space \lambda_n) $$ が導き出されたのか、その過程を見直そう。
🔗固有値と固有ベクトルから導き出される関係
🔗対角行列と固有値、固有ベクトルの関係、対角化
導出の過程を踏まえた上で、\(P\)の列ベクトルが固有ベクトルであることを考えると、列ベクトルの取り替えで順番を入れ替えられることが分かる。
各\(\lambda_i\)は重複度の数だけ斜めに並んでおり、\(\sum_{i=1}^{s} d_i = n\)を満たしている。
両辺に\(P\)を左からかけて、 $$ AP = P \space diag(\lambda_1, \space \dots, \space \lambda_1, \space \dots, \lambda_s, \space \dots, \space \lambda_s) $$
ここで、\(A\)の各行ベクトルを\(\bm{a}_i\)、\(P\)の各列ベクトルを\(\bm{p}_i\)とすると、 $$ AP=(\bm{p}_1, \space \dots, \space \bm{p}_n ) \begin{pmatrix} \lambda_1 & & & & & & \\ & \ddots & & & & & \\ & & \lambda_1 & & & & \\ & & & \ddots & & & \\ & & & & \lambda_s & & \\ & & & & & \ddots & \\ & & & & & & \lambda_s \\ \end{pmatrix} \\ \begin{pmatrix} \bm{a}_1 \bm{p}_1 & \dots & \bm{a}_1 \bm{p}_n \\ \bm{a}_2 \bm{p}_1 & \dots & \bm{a}_2 \bm{p}_n \\ \vdots & \vdots & \vdots \\ \bm{a}_n \bm{p}_1 & \dots & \bm{a}_n \bm{p}_n \end{pmatrix} = ( \lambda_1 \bm{p}_1, \space \dots, \space \lambda_s \bm{p}_n ) $$ となるので、両辺の行列の第\(i\)列ベクトルの関係に着目すると、 $$ A \bm{p}_{i} = \lambda_{k} \bm{p}_n $$ という関係になっていることがわかる。(\(k\)は適当な数)
つまり、最初の\(d_1\)個の\(P\)の列ベクトルは固有値\(\lambda_1\)に属する固有ベクトル、 次の\(d_2\)個の\(P\)の列ベクトルは固有値\(\lambda_2\)に属する固有ベクトル、…、 最後の\(d_s\)個の\(P\)の列ベクトルは固有値\(\lambda_s\)に属する固有ベクトルである。
仮定より、\(P\)は正則行列なので、\(P\)の列ベクトル全体は一次独立である。
\(P\)の列ベクトルの全体のうちの一部も一次独立なので、
固有値\(\lambda_{i}\)に属する固有ベクトル(\(P\)の列ベクトル)の集合も一次独立である。
したがって、少なくとも確実に\(d_{i} \leqq \dim V(\lambda_{i})\)であり、🔗固有値の代数的重複度と幾何的重複度(固有空間の次元)の関係より\(d_{i} \geqq \dim V(\lambda_{i})\)であるので、 $$ d_{i} = \dim V(\lambda_{i}) \quad (i= 1, \space \dots, \space s) $$ となる。
よって\(1 \implies 2\)が示された。
\(2 \implies 3\)の証明 #
仮定より、 $$ \sum_{i=1}^{s} d_i = n $$ かつ $$ d_{i} = \dim V(\lambda_{i}) \quad (i= 1, \space \dots, \space s) $$ なので、代入することによって、直ちに $$ \sum_{i=1}^{s} d_i = \sum_{i=1}^{s} \dim V(\lambda_{i}) = n $$ が示される。
\(3 \implies 4\)の証明 #
\(d_i=\dim V(\lambda_i)\)とすると、仮定より、 $$ \sum_{i=1}^{s} d_i = n $$ である。
\(V(\lambda_i)\)の一組の基底\({b_1}^{(i)}, \space \dots, \space {b_{d_i}}^{(i)}\) の基底をすべて集めた\(n\)個のベクトル $$ {\bm{b}_1}^{(1)}, \space \dots, \space {\bm{b}_{d_1}}^{(1)}, \space \dots, \space {\bm{b}_1}^{(s)}, \space \dots, \space {\bm{b}_{d_s}}^{(s)} $$ が一次独立であることを示せば、\(3 \implies 4\)が示される。
この\(n\)個のベクトルの一次関係式は $$ \sum_{i=1}^{s}\sum_{j=1}^{d_{i}} c_{ij}{\bm{b}_{j}}^{(i)} = \bm{0} $$ とまとめて表すことができる。
そこで、 $$ \bm{v}^{(i)}=\sum_{j=1}^{d_i} c_{ij} {\bm{b}_{j}}^{(i)} $$ と表すと、先程の一次式は $$ \bm{v}^{(1)}, \space \dots, \space \bm{v}^{(s)} = \bm{0} $$ と表され、かつ、 $$ \bm{v}^{(i)} \in V(\lambda_i) $$ である。
🔗相異なる固有値の固有ベクトルの一次独立性より、 \(\bm{v}^{(1)}, \space \dots, \space \bm{v}^{(s)} \)は一次独立なので、 $$ \bm{v}^{(1)}, \space \dots, \space \bm{v}^{(s)} = \bm{0} $$ が自明な一次関係(係数のスカラーが全て\(0\))の場合以外で成り立つと一次独立であることに矛盾する。
よって、\(\bm{v}^{(i)} = \bm{0}\)であることが判明する。
$$ \bm{v}^{(i)}= \sum_{j=1}^{d_{i}} c_{ij}{\bm{b}_{j}}^{(i)} = \bm{0} $$ かつ $$ {\bm{b}_{1}}^{(i)}, \space \dots, \space {\bm{b}_{d_{i}}}^{(i)} $$ が\(V(\lambda_{i})\)の基底であり、一次独立であることより、\(c_{ij}=0\)である。
よって、\(n\)個のベクトル $$ {\bm{b}_1}^{(1)}, \space \dots, \space {\bm{b}_{d_1}}^{(1)}, \space \dots, \space {\bm{b}_1}^{(s)}, \space \dots, \space {\bm{b}_{d_s}}^{(s)} $$ は一次独立である。
\(4 \implies 1\)の証明 #
仮定より、 $$ A \bm{b}_{i}= \lambda_{i} \bm{b}_{i} \quad(i = 1, \space \dots, \space n) $$ かつ\(\bm{b}_{1}, \space \dots, \space \bm{b}_{n}\)が一次独立である。
\(\bm{b}_{i}\)を列ベクトルとして、 $$ P = (\bm{b}_{1}, \space \dots ,\space \bm{b}_{n}) $$ とすると、\(P\)は正則なので、🔗固有値と固有ベクトルから導き出される関係より、 $$ AP = P\begin{pmatrix} \lambda_1 & & O \\ & \ddots & \\ O & & \lambda_n \end{pmatrix} \\ P^{-1}AP = \begin{pmatrix} \lambda_1 & & O \\ & \ddots & \\ O & & \lambda_n \end{pmatrix} $$ である。
複素数体上のベクトル空間の場合 #
複素数体上のベクトル空間について対角化の主定理を考えると、先程の1
~4
の条件が同値なことに加えて、更に同値な条件が存在する。
- \(A\)の各固有値\(\lambda_{i}\)について、\(\lambda_{i}\)の幾何的重複度と代数的重複度が一致する
という条件である。
これは先程の2
の条件の一部なので\(2 \implies 5\)であり、複素数の範囲では代数学の基本定理より、\(n\)次の\(A\)の固有多項式が必ず(重複を込めて)\(n\)個の解をもつので、
$$
\sum_{i=1}^{s} d_{i} = n
$$
である。
よって\(5 \implies 2\)である。
対角化の具体例 #
せっかくなので、具体的な行列を対角化してみる。
$$ \begin{pmatrix} 1 & 0 \\ 1 & 7 \end{pmatrix} $$ という\(2 \times 2\)実行列の対角化について考える。
まず、対角化可能な条件を満たすかどうか確かめるために固有値を求める。
$$ (1-t)(7-t)-0=0 \\ (t-1)(t-7)=0 $$ よって、固有値は\(1,\space 7\)の2つである。
固有値\(1\)の固有空間\(V(1)\)は $$ \begin{pmatrix} 1 -1 & 0 \\ 1 & 7-1 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} =\bm{0} $$ より、 $$ V(1) = \{ r \begin{pmatrix} -6 \\ 1 \end{pmatrix} | \space \forall r \in \Reals \} $$ である。
他方、固有値\(7\)の固有空間\(V(7)\)は $$ \begin{pmatrix} 1 - 7 & 0 \\ 1 & 7 - 7 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} =\bm{0} $$ より、 $$ V(7) = \{ r \begin{pmatrix} 0 \\ 1 \end{pmatrix} | \space \forall r \in \Reals \} $$ である。
固有値が\(2\)つあり、各固有値について、その幾何的重複度(固有空間の次元)は代数的重複度と一致しているので、対角化の主定理より対角化可能であることがわかる。
よって行列\(\begin{pmatrix} 1 & 0 \\ 1 & 7 \end{pmatrix}\)は適当な正則行列\(P\)で $$ P^{-1}\begin{pmatrix} 1 & 0 \\ 1 & 7 \end{pmatrix}P = \begin{pmatrix} 1 & 0 \\ 0 & 7 \end{pmatrix} $$ と対角化される。
具体的に正則行列\(P\)としてどのような行列をとれるのかというと、🔗固有値と固有ベクトルから導き出される関係, 🔗対角行列と固有値、固有ベクトルの関係、対角化を振り返ると分かるように、各列ベクトルが各固有値の固有ベクトルである行列が条件を満たすことが分かる。
一例として、上述の2つの固有値の各固有空間の記述から、係数\(r=1\)として固有ベクトル $$ \begin{pmatrix} -6 \\ 1 \end{pmatrix}, \space \begin{pmatrix} 0 \\ 1 \end{pmatrix} $$ を得て、 $$ P=\begin{pmatrix} -6 & 0 \\ 1 & 1 \end{pmatrix} $$ を得る。
この\(P\)が $$ P^{-1}\begin{pmatrix} 1 & 0 \\ 1 & 7 \end{pmatrix}P= \begin{pmatrix} 1 & 0 \\ 0 & 7 \end{pmatrix} $$ を確かに満たすことを確かめてみよう。
計算は省略するが、\(P^{-1}=\begin{pmatrix} -\frac{1}{6} & 0 \\ \frac{1}{6} & 1 \end{pmatrix}\)なので、上式に代入すると $$ \begin{pmatrix} -\frac{1}{6} & 0 \\ \frac{1}{6} & 1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 1 & 7 \end{pmatrix} \begin{pmatrix} -6 & 0 \\ 1 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 7 \end{pmatrix} $$ となり、左辺の行列の積を計算すると確かに右辺と一致することが分かる。
三角化 #
三角化とは対角化の三角行列版だ。
つまり、\(n\)次正方行列\(A\)に対して、
$$
B= P^{-1} A P
$$
を満たすような正則行列\(P\)と三角行列\(B\)を求める操作のことだ。
対角化の条件は厳しいので、多くは望まないので条件を緩める代わりに三角化させてくれというワケだ。
三角化可能である条件 #
\(n\)次実行列\(A\)は重複を含めて\(n\)個の固有値\(\lambda_{1}, \space \dots, \space \lambda_{n}\)をもつときに、適当な正則行列\(P\)によって $$ P^{-1} AP =\begin{pmatrix} \lambda_{1} & * & * \\ & \ddots & * \\ O & & \lambda_{n} \end{pmatrix} $$ と三角化することができる。
証明 #
\(A\)の次数\(n\)に関して、帰納法を利用して証明する。
\(n=1\)のとき、すでに三角化されているので、\(n \geqq 2\)のとき、\(n-1\)次で定理が成り立つと仮定して、\(n\)次でも定理が成り立つことを示せば良い。
\(A\)を\(n\)次正方行列、\(\lambda_{1}\)をAの固有値のひとつ、\(\bm{x}_{1}\)を\(\lambda_{1}\)に属する固有ベクトルとする。
基底の延長定理を用いて、\(\Reals^n\)から\(n-1\)個のベクトルを選んで加えて\(R^n\)の基底 $$ \bm{x}_{1}, \space \bm{x}_{2}, \space \dots, \space \bm{x}_{n} $$ を得る。(\(\bm{x}_{1}\)以降は固有ベクトルとは限らない。)
$$ P_{1} = (\bm{x}_{1}, \space \bm{x}_{2}, \space \dots, \space \bm{x}_{n}) $$ とすると、\(P_{1}\)は正則であり、適当な\(n-1\)次正方行列\(A_{1}\)を用いて、
$$ AP_{1} = P_{1}\begin{pmatrix} \lambda_{1} & * & \\ 0 & & \\ \vdots & A_{1} & \\ 0 & & \\ \end{pmatrix} \\ {P_{1}}^{-1} AP_{1} = \begin{pmatrix} \lambda_{1} & * & \\ 0 & & \\ \vdots & A_{1} & \\ 0 & & \\ \end{pmatrix} $$
ここで、🔗相似な行列の固有多項式、固有値は一致するので、\({P_{1}}^{-1}AP_{1}\)と\(A\)の固有値は一致する。
いま、仮定より\(A\)の固有値は重複を含めて\(\lambda_{1}, \space \dots \lambda_{n}\)の\(n\)個であり、行列式の性質より、 $$ \begin{vmatrix} A & B \\ O & D \end{vmatrix} = | A | |D| $$ なので、\(A_{1}\)の固有値は\(\lambda_{2}, \space \dots \lambda_{n}\)であることがわかる。
帰納法の仮定で\(n-1\)次の正方行列\(A_{1}\)は三角化可能なので、適当な正則行列\(P_{2}\)で $$ P_{2}^{-1} A_{1} P_{2} = \begin{pmatrix} \lambda_2 & & * \\ & \ddots & \\ O & & \lambda_{n} \end{pmatrix} $$ と三角化できる。
ここで、
$$
X = P_{1} \begin{pmatrix}
1 & 0 & \dots & 0 \\
0 & & & \\
\vdots & & P_{2} & \\
0 & & &
\end{pmatrix}
$$
という行列\(X\)を考えると、\(P_{1}\)、\(\begin{pmatrix}
1 & 0 & \dots & 0 \\
0 & & & \\
\vdots & & P_{2} & \\
0 & & &
\end{pmatrix}\)がそれぞれ正則であり、その積も正則(同型写像の合成に対応する)なので、\(X\)は正則である。
2つめの行列が正則なのは、\(P_{2}\)が正則なので、列ベクトルに着目すると、一次独立になっているから。
そこで、 $$ X^{-1}AX = \begin{pmatrix} 1 & 0 & \dots & 0 \\ 0 & & & \\ \vdots & & P_{2} & \\ 0 & & & \end{pmatrix}^{-1} P_{1}^{-1} A P_{1} \begin{pmatrix} 1 & 0 & \dots & 0 \\ 0 & & & \\ \vdots & & P_{2} & \\ 0 & & & \end{pmatrix} \\ = \begin{pmatrix} 1 & 0 & \dots & 0 \\ 0 & & & \\ \vdots & & P_{2}^{-1} & \\ 0 & & & \end{pmatrix} \begin{pmatrix} \lambda_{1} & * & \\ 0 & & \\ \vdots & A_{1} & \\ 0 & & \\ \end{pmatrix} \begin{pmatrix} 1 & 0 & \dots & 0 \\ 0 & & & \\ \vdots & & P_{2} & \\ 0 & & & \end{pmatrix} \\ = \begin{pmatrix} \lambda_{1} & 0 & \dots & 0 \\ 0 & & & \\ \vdots & & P_{2}^{-1}A_{1}P_{2} & \\ 0 & & & \end{pmatrix} \\ = \begin{pmatrix} \lambda_{1} & & & * \\ & \lambda_{2} & & \\ & & \ddots & \\ O & & & \lambda_{n} \end{pmatrix} $$
となり、\(n\)次の正方行列の\(A\)も三角化可能であることが示された。
よって、帰納法より、題意が示される。
同値 #
上の証明について、逆に考えると、重複を含めて\(n\)個の固有値を持つことと三角化可能なことは同値であることがわかる。
つまり、\(P\)を正則行列として、\(n\)次正方行列\(A\)が $$ P^{-1} AP =\begin{pmatrix} a_{1} & * & * \\ & \ddots & * \\ O & & a_{n} \end{pmatrix} $$ と三角化されるとき、
$$ AP = P \begin{pmatrix} a_{1} & * & * \\ & \ddots & * \\ O & & a_{n} \end{pmatrix} $$ と変形できるのですぐに\(a_{1}, \space \dots, \space a_{n}\)が\(A\)の固有値であることが分かる。
複素数体上のベクトル空間の線形変換の表現行列の三角化可能性 #
長ったらしい言い方になってしまったが、複素行列の場合は代数学の基本定理より、固有方程式が常に重複を含めて\(n\)個の解をもつ。
つまり、固有値が重複を含めて\(n\)個存在するので常に三角化が可能である。
ケーリーハミルトンの定理 #
任意の\(n\)次正方行列\(A\)について、 $$ \phi_{A}(A) = O $$ が成り立つ。
というのがケーリーハミルトンの定理の主張だ。
\(A\)の固有多項式\(\phi_{A}(t)\)に\(t\)の代わりに\(A\)を突っ込むと\(O\)(零行列)になるということだ。
[余談] 行列の多項式 #
余談だが、“普通"の多項式 $$ f(x)=a_{1}x^{n} + a_{2}x^{n-1} + \dots + a_{n} $$ に関して $$ f(A)=a_{1}A^{n} + a_{2}A^{n-1} + \dots + E a_{n} $$ を定義する。
\(f(A)\)を多項式\(f(x)\)に\(A\)を代入して得た行列、または行列多項式という。
定理の証明 #
複素数体上のベクトル空間についての線形変換の表現行列である、\(n\)次複素正方行列を\(A\)とする。
$$ n次複素正方行列全体の集合 \supset n次実正方行列全体の集合 $$ なので、実数体上のベクトル空間についての線形変換についての議論も、複素数体上でまとめておこなって問題ない。
いま、\(A\)は代数学の基本定理より、固有方程式\(\phi_{A}(t)=0\)が重複を込めて\(n\)個の解をもつ。
つまり、\(A\)は\(n\)個の固有値\(\lambda_{1}, \space \dots, \space \lambda_{n}\)をもつ。
よって、固有多項式\(\phi_{A}(t)\)は以下のように因数分解することができる。
$$
\phi_{A}(t)=(\lambda_{1}- t)(\lambda_{2}- t)\dots(\lambda_{n}- t)
$$
\(\phi_{A}(t)\)に\(t\)の代わりに\(A\)を突っ込んだ行列多項式\(\phi_{A}(A)\)は $$ \phi_{A}(A)=(\lambda_1 E - A)(\lambda_2 E - A)\dots(\lambda_n E - A) $$ である。
ここで、仮定より\(A\)は複素行列なので、\(A\)を以下のように三角化することができる。(🔗三角化可能である条件)
$$
P^{-1}AP= \begin{pmatrix} \lambda_{1} & * & * \\
& \ddots & * \\
O & & \lambda_{n}
\end{pmatrix}
$$
そのことを踏まえた上で、 $$ P^{-1}\phi_{A}(A)P= P^{-1}(\lambda_1 E - A)(\lambda_2 E - A)\dots(\lambda_n E - A)P \\ = P^{-1}(\lambda_1 E - A)PP^{-1}(\lambda_2 E - A)PP^{-1} \dots PP^{-1}(\lambda_n E - A)P $$ であり、 \(\lambda_{i}E\)の可換性(🔗対角行列の可換性)より $$ P^{-1}(\lambda_i E)P=P^{-1}P(\lambda_i E) = \lambda_i E $$ なので、 $$ P^{-1}(\lambda_i E -A) P = P^{-1} (\lambda_i E P - AP) \\ = P^{-1} \lambda_i E P - P^{-1}AP \\ = \lambda_i E - P^{-1}AP $$ であるから、上式を更に変形して、 $$ = (\lambda_1 E - P^{-1}AP) (\lambda_2 E - P^{-1}AP) \dots (\lambda_n E - P^{-1}AP) $$ となる。
あとはこの行列が零行列になることを示すだけだ。
帰納法で示す。
\(k=1\)のとき、 $$ (\lambda_1 E - P^{-1}AP) = \begin{pmatrix} \lambda_{1} -\lambda_{1} & & & * \\ & \lambda_{1} - \lambda_{2} & & \\ & & \ddots & \\ O & & & \lambda_{1} - \lambda_{n} \end{pmatrix} \\ = \begin{pmatrix} 0 & & & * \\ & \lambda_{1} - \lambda_{2} & & \\ & & \ddots & \\ O & & & \lambda_{1} - \lambda_{n} \end{pmatrix} $$ のように、第一列の成分が全て\(0\)になる。
次に、帰納法のステップが動くことも示す。
\(k\)のときに、 $$ (\lambda_1 E - P^{-1}AP) \dots(\lambda_k E - P^{-1}AP) = \begin{pmatrix} 0_1 & \dots & 0_k & \\ \vdots & & \vdots & * \\ 0 & \dots & 0 & \end{pmatrix} $$
のように最初の\(k\)列は全て成分が\(0\)であると仮定すると、
$$ (\lambda_1 E - P^{-1}AP) \dots(\lambda_{k+1} E - P^{-1}AP) \\ = \begin{pmatrix} 0_1 & \dots & 0_k & \\ \vdots & & \vdots & * \\ 0 & \dots & 0 & \end{pmatrix} (\lambda_{k+1} E - P^{-1}AP) \\ = \begin{pmatrix} 0_1 & \dots & 0_k & \\ \vdots & & \vdots & * \\ 0 & \dots & 0 & \end{pmatrix} \tiny \begin{pmatrix} \lambda_{k+1} - \lambda_{1} & & & & & * \\ & \lambda_{k+1} - \lambda_{2} & & && \\ & & \ddots & & & \\ & & & 0 & & \\ & & & & \ddots & \\ O & & & & & \lambda_{k+1} - \lambda_{n} \end{pmatrix} \\ \normalsize = \begin{pmatrix} 0_1 & \dots & 0_{k+1} & \\ \vdots & & \vdots & * \\ 0 & \dots & 0 & \end{pmatrix} $$ のように\(k+1\)のときに第\(k+1\)列までの成分がすべて\(0\)になる。
よって、帰納法より、 $$ P^{-1}\phi_{A}(A)P=O $$ であり、 $$ \phi_{A}(A)= POP^{-1} = O $$ となるので証明完了。
ケーリーハミルトンの定理の利用 #
で、こんな定理が一体なんの役に立つんだ? と思うわけだが、🔗wikipeida曰く簡単な応用例としては行列の次数下げに利用できるらしい。
\(\phi_{A}(A)=O\)より、 $$ A^n + a_{n-1} A^{n-1}+\dots +a_{1}A + a_{0} E = O $$ という関係を得られるので、移項して、 $$ A^n = -(a_{n-1} A^{n-1}+\dots +a_{1}A + a_{0} E) $$ となり、\(A^n\)を次数の低い行列多項式で置き換えることができる。
編集後記 #
ケーリーハミルトンの定理の印象 #
ケーリーハミルトンの定理は $$ \phi_{A}(A)=O $$ と、\(A\)の固有多項式に\(A\)を突っ込むと結果は零行列になるというものだが、なんとなく陰な印象を受ける。
40代未婚ワープアおっさんがVTuberにお金を使ったら後には何も残らなかったみたいな感じだ。
虚しい定理だ。
皆さんはどんな印象を受けるだろうか?
なぜ、どのようにしてこの定理を導き出した、導き出そうとしたのかを知りたいが何も分からなかった。
これに限らず数学には定理が山ほどあり、初めてその定理が発見された当時どのような状況(関連定理の開拓具合など)だったのかなどの情報までもが残されている事は少ないので、定義や定理の動機や意義に関しては自分の数学レベルが高くなければ理解できないと思った。