本記事では、行列を線形写像の観点から解説します。
具体的には、行列を、その行列を構成する列ベクトルが生成するスパンと解釈する見方を土台にして、像と全射、核と単射の関連を説明します。
なお、最低限の集合と写像の知識が必要となるので、これらに不安のある方は、こちらの「線形代数のための集合 / 写像の総まとめ」を先に読んでもらえると本記事の理解がスムーズになるはずです。
線形写像と行列
線形写像とは
\( V,W\)をベクトル空間とし、写像\( f:V \to W\) が与えられているとする。\( f\)が次の2つの性質を満たすとき、\( f\)を線形写像という。
- 任意の\(\mathbf{x}, \mathbf{y} \in V \) に対して、\( f(\mathbf{x} + \mathbf{y} ) = f(\mathbf{x} ) + f(\mathbf{y}) \)
- 任意の実数\( c \in R\)と任意の\( \mathbf{x} \in V\) に対して、\( f(c \mathbf{x} ) = c f(\mathbf{x} )\)
線形写像と行列の関係
\( f:R^n \to R^p\) を線形写像とする。このとき、ある\( p \times n\) 行列\( A\)が存在して、\( f\)は
\[f(\mathbf{x} ) = A \mathbf{x} \:\:\:\: (\mathbf{x} \in R^n)\]
と表される。この\( A\)を(標準基底に関する)\( f\) の表現行列という。
簡単に言えば、線形写像\( f\) があったとき、それは行列で表すことができるということ。すなわち、行列とは線形写像である。
\(p \times n\)行列\(A\)が表す線形写像
行列\( A\)をn個のp次元ベクトル\( {\mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_n}} \) を横に並べた\( p\times n\) 行列として定める。
\[A = ({\mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_n}}),\:\:\: \mathbf{a_i} = \begin{pmatrix}a_{i1}\\a_{i2}\\ \vdots\\ a_{ip}
\end{pmatrix}\]
次に、n次元ベクトル\( \mathbf{x} \)を
\[\mathbf{x} = \begin{pmatrix}x_{1}\\x_{2}\\ \vdots\\ x_{p}
\end{pmatrix} \in R^n\]
とおくと、\( \mathbf{x} \)はn次元ベクトル空間\( R^n\) に属する。
ここで、\( A\)の右から\( \mathbf{x} \)を掛け、結果として得られるベクトルを\( \mathbf{y} \) とすると、\( \mathbf{y} \)は以下のように表される。
\begin{align*}
\mathbf{y} &= A \mathbf{x} \\
&= ({\mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_n}}) \begin{pmatrix}x_{1}\\x_{2}\\ \vdots\\ x_{p}
\end{pmatrix} \\
&= x_1\mathbf{a_1} + x_2\mathbf{a_2} + \cdots + x_n\mathbf{a_n}\\
\end{align*}
ここから、\( \mathbf{y} \)がp個の成分からなるp次元ベクトルであり、従って、\( \mathbf{y} \)がp次元ベクトル空間\( R^p\) に属することが分かる。
以上より、\( p \times n\) 行列\( A\)は、入力としてn次元ベクトル\( \mathbf{x} \) を受け取り、p次元ベクトル\( \mathbf{y} \) を出力する定義域\( R^n\)から終域\( R^p\)への写像(線形写像)を表していることが確認できる。
線形写像に関連する4つの集合/空間
\(p \times n\)行列\(A\)は、n次元ベクトル\(\mathbf{x} \)をインプットすれば、p次元ベクトル\(\mathbf{y}\)をアウトプットする写像でした。
この\(A\)による写像は、以下の4つの空間と不可分な関係にあります。
- \( A\)の定義域の空間: \( R^n\)
- \( A\)の終域の空間: \( R^p\)
- \( A\)の像: \( \mathbf{Im} \)
- \( A\)の核: \( \mathbf{Ker}\)
\(A\)の定義域 \(R^n\)
\( p \times n \)行列\( A\)の定義域\( R^n\)とは、\( A\)に入力するn次元ベクトル\(\mathbf{x} \)が属する空間です。
$$ \mathbf{x} \equiv \begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} \in R^n$$
また、その次元は
$$ \dim R^n = n$$
となります。つまり、\(p \times n \)行列\( A\)の定義域の\( R^n\)の次元は、\( A\)の列数\( n\)に一致します。
\(A\)の終域 \(R^p\)
\( p \times n\)行列\( A\)の終域\( R^p\)とは、\( A\)が出力するp次元ベクトル\( \mathbf{y} \)が属する空間です。
$$ \mathbf{y} \equiv \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_p \end{pmatrix} \in R^p$$
また、その次元は
$$ \dim R^p = p $$
です。つまり、\(p \times n \)行列\( A\)の終域\( R^n\)の次元は、\( A\)の行数\( n\)に一致します。
\(A\)の像(値域) \(\mathrm{Im} A\)
\( p \times n\) 行列\( A\)の像\( \mathrm{Im} A\)とは、
\[\mathrm{Im} A = \{A \mathbf{x} \in R^p |\: \mathbf{x} \in R^n\}\]
で定義される\( A\) の終域\( R^p\) の部分空間。
また、
\begin{align} A \mathbf{x} &= (\mathbf{a_1} \mathbf{a_2} \cdots \mathbf{a_n})\begin{pmatrix} x_1\\ x_2\\ \vdots \\ x_n \end{pmatrix} \\
&= x_1\mathbf{a_1} + x_2\mathbf{a_2} + \cdots + x_n\mathbf{a_n}\\
&= \mathrm{Span}[\mathbf{a_1},\mathbf{a_2}, \cdots, \mathbf{a_n}] \end{align}
より
\[ \mathrm{Im} A = \mathrm{Span}[\mathbf{a_1},\mathbf{a_2}, \cdots, \mathbf{a_n}] \]
つまり、\( p\times n\) 行列\( A\)の像\( \mathrm{Im} A\) とは、\( A\)を構成するn個の列ベクトル\(\mathbf{a_1},\mathbf{a_2}, \cdots, \mathbf{a_n}\) の線形結合によって生成される空間である。このことから、\( \mathrm{Im} A\)は、行列\( A\)の列ベクトル空間とも言われる。
また、\( A\)の像の次元\( \dim \mathrm{Im} A\)は\( A\) のランク\( \mathrm{rank} A\) とも言う。つまり、
\[\mathrm{rank} A = \dim \mathrm{Im} A\]
以上を踏まえると、像の次元に関して以下の関係式が成り立つ。
\[\mathrm{rank} A = \dim \mathrm{Im} A = \dim \mathrm{Span}[\mathbf{a_1},\mathbf{a_2}, \cdots, \mathbf{a_n}] \]
ここから、\( \mathrm{rank} A\)または\( \mathrm{Im} A\) の次元は、\( \mathrm{Span}[\mathbf{a_1},\mathbf{a_2}, cdots, \mathbf{a_n}]\) を構成するベクトル\( {\mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_n}} \) のうち、線形独立なベクトルの最大個数に一致することになる。
\(A\)の核 \(\mathrm{Ker} A\)
\( p \times n\) 行列\( A\)の核\( \mathrm{Ker} A\)とは、\( R^n\)を\( A\)の定義域とすれば
\[\mathrm{Ker} A = \{\mathbf{x} \in R^n |\, A \mathbf{x} = \mathbf{0}\}\]
で定義される\( R^n\) の部分空間。
定義から、\( \mathrm{Ker} A\)は、\( A\)による\( \mathbf{0} \in \mathrm{Im} A\) の逆像、つまり、\( A\) によって\( \mathbf{0}\in \mathrm{Im} A\) に移される\( \mathbf{x} \)を集めた集合であることが分かる。
行列が表す線形写像の分析
像の次元と全射
\( p \times n\) 行列\( A\)に対して、\( A\)の終域を\( R^p\)とすれば、
\[\mathrm{rank} A = p \Leftrightarrow \mathrm{Im} A = R^p\,(A\mathrm{は全射})\]
すなわち、\( p \times n\) 行列\( A\)が表す線形写像\( f_A:R^n \to R^p\) が全射であるための必要十分条件は、\( \mathrm{rank} A = p\) ということ。
【証明】
まず、\( \mathrm{rank} A = p\)を仮定する。\( \mathrm{Im} A = R^p\) の証明には、\( \mathrm{Im} A\)の定義より\( \mathrm{Im} A \subset R^p\) は保証されるから、\( \mathrm{Im} A \supset R^p\) だけを示せばよい。
\( \mathrm{rank} A = \dim \mathrm{Im} A\) より、\( \dim \mathrm{Im} A = p\)。よって、\( \mathrm{Im} A\)にはp個の基底\( {\mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_p}} \) が存在する。また、\( \mathrm{Im} A \subset R^p\) なので、\( \mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_p} \in R^p\) 。
一方、\( R^p\)の任意のベクトルは、\( R^p\)のp個の基底の線形結合で一意に表されるが、ここでは\(\mathrm{Im} A \)の基底\( {\mathbf{a_1} ,\mathbf{a_2} \cdots ,\mathbf{a_p}}\)を\( R^p\) の基底として採用する。
すると、任意の\( \mathbf{x} \in R^p\) は、ある実数\( c_1,c_2,\cdots, c_p\)が存在して、
\begin{align*}
&\mathbf{x} = c_1 \mathbf{a_1} + c_2 \mathbf{a_2} + \cdots + c_p \mathbf{a_p} \\
&\Rightarrow \mathbf{x} \in \mathrm{Im} A
\end{align*}
これより、\( \mathrm{Im} A \supset R^p\) が示されたので、\( \mathrm{Im} A = R^p\) となり、\( \mathrm{rank} A = p\)を仮定し\( A\)が全射であることが示された。
逆に、\( \mathrm{Im} A = R^p \,(A\mathrm{は全射})\) $を仮定する。
仮定から\( \dim \mathrm{Im} A = \dim R^p = p\) であり、また\( \dim \mathrm{Im} A = \mathrm{rank} A\) なので、\( \mathrm{rank} A = p\)
以上より、\( \mathrm{Im} A = R^p\)を仮定し、\( \mathrm{rank} A = p\)が示された。
核の次元と単射
\( p \times n\) 行列\( A\)に対して、
\[A\mathrm{は単射} \Leftrightarrow \mathrm{Ker} A = \{\mathbf{0}\}\]
すなわち、\(p \times n\) 行列\( A\)が表す線形写像\( f_A:R^n \to R^p\) が単射であるための必要十分条件は、\( \mathrm{Ker} A = \{\mathbf{0}\}\) ということ。
【証明】
\( A\) が単射と仮定する。すなわち、任意の\( \mathbf{x_1} \mathbf{x_2} \in R^n\) に対し、\( \mathbf{x_1} \neq \mathbf{x_2} \Rightarrow A \mathbf{x_1} \neq A \mathbf{x_2}\)である。
\(\mathbf{x} = \mathbf{x_1} – \mathbf{x_2} \)とおき、\( \mathbf{x_1} \neq \mathbf{x_2}\) つまり\( \mathbf{x} \neq \mathbf{0}\) とすれば、
\[A \mathbf{x} = A(\mathbf{x_1} – \mathbf{x_2} ) = A \mathbf{x_1} – A \mathbf{x_2} \neq \mathbf{0}\]
これは、\( \mathbf{0}\) (ゼロベクトル)以外の任意の\( \mathbf{x} \in R^n\) に対しては、\( A\)で移しても決して\( \mathbf{0}\in \mathrm{Im} A\) には移らないことを意味している。\\
ここから、\( \mathbf{0}\in \mathrm{Im} A\) に移る\( R^n\)のベクトルは\( \mathbf{0}\) のみということになる。すなわち、\( \mathrm{Ker} A = \{\mathbf{0}\}\) 。
以上より、$A$\( A\) が単射であることを仮定して、\( \mathrm{Ker} A = \{\mathbf{0}\}\) が導かれた。
逆に、\( \mathrm{Ker} A = \{\mathbf{0}\}\) を仮定する。
任意の\( \mathbf{x_1},\mathbf{x_2} \in R^n\) に対し、ある\( \mathbf{b} \in \mathrm{Im} A\) が存在して、
\[A \mathbf{x_1} = A \mathbf{x_2} = \mathbf{b} \]
を満たすとする。つまり、\( \mathbf{x_1}, \mathbf{x_2} \in R^n \)はともに、\( A\)によって同じ\( \mathbf{b} \in \mathrm{Im} A\)に移されるということ。
ここで、\( \mathbf{x_1} – \mathbf{x_2} \in R^n \) とおけば、
\[A(\mathbf{x_1} – \mathbf{x_2} ) = A \mathbf{x_1} – A \mathbf{x_2} = \mathbf{b} – \mathbf{b} = \mathbf{0}\]
すなわち、\( \mathbf{x_1}- \mathbf{x_2} \)は、\( A\)で\( \mathbf{0} \in \mathrm{Im} A\) に移されるベクトルなので、
\[\mathbf{x_1} – \mathbf{x_2} \in \mathrm{Ker} A\]
ただし、今は\( \mathrm{Ker} A = \{\mathbf{0}\}\) を仮定しているので、
\[\mathbf{x_1} – \mathbf{x_2} = \mathbf{0} \Rightarrow \mathbf{x_1} = \mathbf{x_2} \]
以上を踏まえると、
\[\mathrm{任意の}\mathbf{x_1} ,\mathbf{x_2} \in R^n \mathrm{に対し、} A \mathbf{x_1} = A \mathbf{x_2} \Rightarrow \mathbf{x_2} = \mathbf{x_2} \]
これは、\( A\) が単射であることの定義である。これで、\( \mathrm{Ker} A = \{\mathbf{0}\}\) を仮定して、\( A\)が単射であることが示された。
線形写像が全単射であるための必要十分条件
n次正方行列行列\( A\)に対して、
\[A \mathrm{は全単射} \Leftrightarrow \mathrm{rank} A = n \]
すなわち、n次正方行列\( A\)により定まる線形変換\( A:R^n \rightarrow R^n\) が全単射であるための必要十分条件は、\( \mathrm{rank} A = n\) が成り立つこと。また、このとき、\( A\)の逆写像\( A^{-1}:R^n \rightarrow R^n\) が定まる。
【証明】
\( A\)が全単射であると仮定する。
\(A \)は全射なので、像の次元と全射の関係から、\( \mathrm{Im} A\)と\( A\)の終域\( R^n\) は等しく、\( \mathrm{rank} A = \dim \mathrm{Im} A = \dim R^n = n\)
以上より、\( A\)の全単射を仮定し、\( \mathrm{rank} A = n\)が示された。
次に、\(\mathrm{rank} A = n \)を仮定する。
\(\mathrm{rank} A = \dim \mathrm{Im} A = n =\dim R^n \)より、像の次元と全射の関係から、\( A\)は全射となる。
一方で、次元定理より、\( \dim \mathrm{Ker} A = \dim \mathrm{Im} A – \dim R^n = n – n = 0\)より、\( \dim \mathrm{Ker} A = 0\) なので、核の次元と単射の関係から\( A\)は単射となる。
以上より、\( \mathrm{rank} A = b\) を仮定して、n次正方行列\( A\)が全単射であることが示された。