Matriisit työkaluina

# lineaarinen

Lineaarinen yhtälöryhmä $A\ve{x}=\ve{b}$

Lineaarisessa yhtälöryhmässä ratkaistavat muuttujat esiintyvät lineaarisina termeinä, eli kerrottuna jollain vakiolla. Esimerkkejä epälineaarisista termeistä ovat 3x^2, $\frac 1x$ , ja $\ln(x).$

Lineaarinen yhtälöryhmä on esimerkiksi $\begin{cases} x+y +z &= 3 \\ x-z &= 0\\ y+z &= 2, \end{cases}$ jossa ratkaistavia muuttujia on kolme: ja

Yleisesti $n\text{:n}$ muuttujan $x_1, x_2, \dots, x_n$ ja $m\text{:n}$ yhtälönYhtälöryhmä voidaan ratkaista, jos $m\ge n.$ lineaarinen yhtälöryhmä on $\begin{cases} a_{11} \hred {x_1}+a_{12}\hgreen{x_2} + \dots + a_{1n}\hblue{x_n} &= b_1 \\ a_{21}\hred {x_1}+a_{22}\hgreen{x_2}+ \dots + a_{2n}\hblue{x_n} &= b_2\\ \vdots&\vdots\\ a_{m1}\hred {x_1}+a_{m2}\hgreen{x_2}+ \dots + a_{mn}\hblue{x_n} &= b_m, \end{cases}$ missä $a_{ij}$ ja b_i ovat vakioita. Tämä voidaan kirjoittaa matriisiyhtälönä $\begin{bmatrix} a_{11}&a_{12}& \dots & a_{1n} \\ a_{21}&a_{22}& \dots & a_{2n}\\ \vdots &\vdots&\ddots&\vdots\\ a_{m1}&a_{m2}& \dots & a_{mn} \end{bmatrix} \begin{bmatrix} \hred {x_1} \\ \hgreen {x_2}\\ \vdots\\ \hblue {x_n} \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2\\ \vdots\\ b_m \end{bmatrix}$ tai lyhyesti $A\ve x = \ve b,$ missä on $m\times n$ -kerroinmatriisi ja $\ve b$ on vakiovektori.

Ratkaistavana on siis vektori $\ve x,$ jonka komponentteina on yhtälöryhmän muuttujat.

Olkoon kääntyvä $n\times n$ -matriisi. Yhtälöllä $A\ve{x}=\ve{b}$ on tällöin yksikäsitteinen ratkaisu $\ve{x}=A^{-1}\ve{b}$ kaikilla vakiovektoreilla $\ve{b}\in \mathbb{R}^n$ .

Neliömatriisille seuraavat ehdot ovat yhtäpitäviä:

1. Matriisin sarakkeet ja rivit ovat lineaarisesti riippumattomat. $\newline$ 2. $\det (A) \neq 0.$ $\newline$ 3. on kääntyvä. $\newline$ 4. Yhtälöllä $A\ve{x}=\ve{b}$ on (yksikäsitteinen) ratkaisu jokaiselle $\ve{b} \in \mathbb{R}^n.$ $\newline$ 5. Yhtälöllä $A\ve{x}=0$ on vain triviaaliratkaisu $\ve{x}=0$ .

Esimerkki. Lineaarisen yhtälöryhmän ratkaiseminen.

Yhtälöryhmän $\begin{equation*} \begin{cases} 2x_1 +x_2 &=2\\ 3x_1 &= -1 \end{cases} \end{equation*}$ kerroinmatriisi on $A= \begin{bmatrix} 2 &1\\ 3 &0 \end{bmatrix}$ , $\det (A)= -3 \neq 0$ , joten se on kääntyvä ja

$A^{-1}=-\frac{1}{3} \begin{bmatrix} 0 &-1\\ -3 &2 \end{bmatrix} = \begin{bmatrix} 0 &\frac{1}{3}\\ 1 &-\frac{2}{3} \end{bmatrix}.$

Näin ollen yhtälöryhmän $A\ve{x}=\ve{b}$ ainoa ratkaisu $\ve{x}=A^{-1}\ve{b}$ on

$\ve{x} = \begin{bmatrix} 0 &\frac{1}{3}\\ 1 &-\frac{2}{3} \end{bmatrix} \begin{bmatrix} 2\\ -1 \end{bmatrix} = \begin{bmatrix} -\frac{1}{3}\\ 2\frac{2}{3} \end{bmatrix}$ eli $x_1=-\frac{1}{3}$ ja $x_2=2\frac{2}{3}$ .

# kasitteet

Tärkeitä käsitteitä

# vektoriavaruus

Vektoriavaruus ja aliavaruus

$\begin{tikzpicture}[line cap=rect,line width=2pt, scale=0.8] \filldraw [fill=black!10] (0,0) circle [radius=2cm]; \foreach \angle [count=\xi] in {60,30,...,-270} { \draw[line width=1pt] (\angle:1.8cm) -- (\angle:2cm); \node[font=\large] at (\angle:1.36cm) {\textsf{\xi}}; } \foreach \angle in {0,90,180,270} \draw[line width=2pt] (\angle:1.6cm) -- (\angle:2cm); \draw[->] (0,0) -- (180:0.8cm); % pikkuviisari 9 \draw[->] (0,0) -- (90:1cm); % isoviisari 12 \end{tikzpicture} \begin{tikzpicture}[scale=0.8] \draw[] (0,0)++(0,1.8) node [anchor=south] {+}; \end{tikzpicture} \begin{tikzpicture}[line cap=rect,line width=2pt, scale=0.8] \filldraw [fill=black!10] (0,0) circle [radius=2cm]; \foreach \angle [count=\xi] in {60,30,...,-270} { \draw[line width=1pt] (\angle:1.8cm) -- (\angle:2cm); \node[font=\large] at (\angle:1.36cm) {\textsf{\xi}}; } \foreach \angle in {0,90,180,270} \draw[line width=2pt] (\angle:1.6cm) -- (\angle:2cm); \draw[->] (0,0) -- (330:0.8cm); % pikkuviisari 4 \draw[->] (0,0) -- (90:1cm); % isoviisari 12 \end{tikzpicture} \begin{tikzpicture}[scale=0.8] \draw[] (0,0)++(0,1.8) node [anchor=south] {=}; \end{tikzpicture} \begin{tikzpicture}[line cap=rect,line width=2pt, scale=0.8] \filldraw [fill=black!10] (0,0) circle [radius=2cm]; \foreach \angle [count=\xi] in {60,30,...,-270} { \draw[line width=1pt] (\angle:1.8cm) -- (\angle:2cm); \node[font=\large] at (\angle:1.36cm) {\textsf{\xi}}; } \foreach \angle in {0,90,180,270} \draw[line width=2pt] (\angle:1.6cm) -- (\angle:2cm); \draw[->] (0,0) -- (60:0.8cm); % pikkuviisari 1 \draw[->] (0,0) -- (90:1cm); % isoviisari 12 \end{tikzpicture}$

Vektoriavaruutta voisi kuvata 12 tunnin kello. Minkä tahansa kahden kellonajan summa pysyy aina kellonaikojen 1-12 välillä. Esimerkkikellossamme on laskettu kellonajat 9+4 ja saatu 1. Vaikka laskennallisesti tulos menisikin avaruuden ulkopuolelle (9+4=13), se kuitenkin pyörähtää takaisin "kelloavaruuteen". Samoin, jos lisätään 9 tuntia 6 kertaa kellonaikaan 12, saamme 12+54=66. Kellossamme aika tällöin on kuitenkin 6. Kahdentoista tunnin kello toimii aliavaruutena 24 tunnin kellolle! (Tämä esimerkki on tehty äärelliseen tapaukseenAlkioiden määrä on pienempi kuin $\infty$ .. Yleensä vektoriavaruuksia käsitellään äärettöminä.)

Vektoriavaruus

Vektoriavaruus on joukko vektoreita, joille on määritelty laskusääntöjä. Esimerkiksi kahden avaruuteen kuuluvan vektorin summa on kolmas vektori, joka myös kuuluu avaruuteen.

Reaalinen vektoriavaruus on epätyhjä joukko , jossa on määritelty kaksi laskutoimitusta, yhteenlasku ja reaaliluvulla kertominen, niin, että seuraavat aksioomat ovat totta kaikille vektoreille $\ve{u}, \ve{v}, \ve{w} \in V$ ja kaikille reaaliluvuille $c, d \in \mathbb{R}$ :

$\ve{u}+\ve{v} \in V$ (Suljettu yhteenlaskun suhteen)
$(\ve{u} + \ve{v}) + \ve{w} = \ve{u} + (\ve{v}+\ve{w})$
on olemassa nollavektori $\ve{0}= \ve{0}_V \in V$ , jolle pätee $\ve{0}+\ve{u}=\ve{u}+\ve{0} = \ve{u}$ kaikilla $\ve{u} \in V$
jokaiselle $\ve{u} \in V$ on olemassa vastavektori $-\ve{u} \in V$ siten, että $\ve{u}+(-\ve{u})=\ve{0}$
$\ve{u} + \ve{v} = \ve{v} + \ve{u}$
$c \cdot \ve{u} \in V$ (Suljettu skalaarilla kertomisen suhteen)
$c (\ve{u}+\ve{v})=c\ve{u} + c\ve{v}$
$(c+d)\ve{u}=c\ve{u}+d\ve{u}$
$c(d\ve{u})=(cd)\ve{u}$
$1\cdot\ve{u}=\ve{u}$

Huomautuksia. Ominaisuudet 1-5 tarkoittavat, että on Abelin ryhmä yhteenlaskun suhteen. "Suljettu laskutoimituksen suhteen" tarkoittaa sitä, että kahden vektorin summan tulee pysyä vektoriavaruudessa ja reaaliluvulla kerrottu vektori pysyy myös vektoriavaruudessa.

$\begin{tikzpicture} % tehdään kuutiot \foreach \s in {-1,-0.8,-0.6,-0.40, ..., 0.8,1} { \foreach \d in {-1,-0.8,-0.6,-0.40, ..., 0.8,1} { %\draw [blue!20, thin] (\s, \d, -1 ) to (\s,\d,1); %\draw [blue!20, thin] (\s, -1, \d ) to (\s,1,\d); \draw [black!20, thin, ->] (\d, \s, -1 ) to (\d,\s,1); \draw [black!20, thin, ->] (-1, \s, \d ) to (1,\s,\d); \draw [black!20, thin, ->] (\d, -1,\s) to (\d,1,\s); %\draw [blue!20, thin] (-1, \d,\s) to (-1,\d,\s); }} \draw[thick,->] (-1,0,0) -- (1,0,0) node[right]{$y$}; \draw[thick,->] (0,-1,0) -- (0,1,0) node[above]{$z$}; \draw[thick,->] (0,0,-1) -- (0,0,1) node[below]{$x$}; \end{tikzpicture}$

Vektoriavaruus $\mathbb{R}^3$ :ssa on koko avaruus, jonka -, - ja -akselit virittävät.

Aliavaruus

Vektoriavaruuden osajoukko on :n aliavaruus seuraavien ehtojen toteutuessa:

$\ve{0}_V \in W$
jos $\ve{v} \in W$ , niin myös $c\ve{v} \in W$ kaikilla $c \in \mathbb{R}$
jos $\ve{v}, \ve{w} \in W$ , niin myös $\ve{v}+\ve{w}\in W$ .

On hyvä huomata, että on myös itse vektoriavaruus, sillä se toteuttaa kaikki vektoriavaruuden aksioomat.

$\begin{tikzpicture} \begin{axis}[ % hide axis, axis line style = thick, axis lines = middle, yticklabels=\empty, xticklabels=\empty, zticklabels=\empty, view={135}{15}, %colormap/cool, %domain = -10:10, colormap={whiteblue}{color=(gray!50) color=(gray!40)} ] \addplot3[ mesh ] {0}; \end{axis} \end{tikzpicture}$

Avaruuden $\mathbb{R}^3$ aliavaruus on esimerkiksi origon kautta kulkeva $\mathbb{R}^2$ :n -taso. Voisiko jokin muukin olla $\mathbb{R}^3$ :n aliavaruus? Entä $\mathbb{R}^2$ :n aliavaruus? Vastaus.Ainakin reaaliakselit ja .

# linriippumattomuus

Lineaarinen riippumattomuus ja matriisit

Lineaarinen riippumattomuus ja lineaarikombinaatiot

Avaruuden $\mathbb{R}^n$ vektorit $\ve{v}_1, \ve{v}_2, \,\dots, \ve{v}_n$ ovat lineaarisesti riippumattomattomat eli LI (linearly independent) jos ja vain jos ehto $c_1\ve{v}_1+c_2\ve{v}_2+ \dots + c_k\ve{v}_k= \ve{0}$ toteutuu ainoastaan, kun $c_1=c_2=\dots=c_k=0$ . Toisin sanoen mitään vektoreista ei voida muodostaa summaamalla muita vakiolla kerrottuja vektoreita.

Muussa tapauksessa vektorit ovat lineaarisesti riippuvat eli LD (linearly dependent). Lineaarinen riippuvuus tarkoittaa, että vektorit voidaan esittää toistensa lineaarikombinaationa.

Seuraavat ehdot ovat yhtäpitäviä (eli yhdestä seuraa loput) neliömatriiseille $A_{n\times n}$ : $\newline$ 1. Matriisin sarakkeet ja rivit ovat lineaarisesti riippumattomat. $\newline$ 2. $\det (A) \neq 0.$ $\newline$ 3. on kääntyvä. $\newline$ 4. Yhtälöllä $A\ve{x}=\ve{b}$ on (yksikäsitteinen) ratkaisu jokaiselle $\ve{b} \in \mathbb{R}^n.$ $\newline$ 5. Yhtälöllä $A\ve{x}=0$ on vain triviaaliratkaisu $\ve{x}=0$ . $\newline$

Esimerkki. Lineaarinen riippumattomuus.

Ovatko vektorit $\ve{v}_1= \begin{bmatrix} 6 \\ -2 \end{bmatrix}$ ja $\ve{v}_2= \begin{bmatrix} -4 \\ 5 \end{bmatrix}$ lineaarisesti riippumattomat?

Ratkaisu. Kirjoitetaan vektorit matriisimuotoon $A = \begin{bmatrix} 6 &-4 \\ -2 &5 \end{bmatrix}$ ja lasketaan sen determinantti $\det A=6\cdot 5 - (-4)\cdot (-2) = 30-8=22 \neq 0$ . Koska $\det A \neq 0$ niin vektorit $\ve{v}_1$ ja $\ve{v}_2$ ovat lineaarisesti riippumattomat.

$\begin{tikzpicture}[scale=0.5] % (y, x, z) \coordinate (P1) at (6,-2); \coordinate (P2) at (-4, 5); \coordinate (P3) at (2, 3); \coordinate (O) at (0,0); %akselit \draw[help lines, color=gray!30, dashed] (-4.9,-2.9) grid (6.9,5.9); \draw[->, color=black!50] (-5,0)--(7,0) node[right]{$x$}; \draw[->, color=black!50] (0,-3)--(0,6) node[above]{$y$}; %akselit % Piirretään ala \filldraw[black!50, fill=gray!15] (P1)--(P3)--(P2)--(O)--cycle; % % piirretään vektorit \draw[->, red, thick] (O)--(P1) node[midway, below]{$\vec{v}_1$}; \draw[->, blue, thick] (O)--(P2) node[midway, below]{$\vec{v}_2$}; % \end{tikzpicture}$

Vektorit eivät osu samalle suoralle, jolloin niiden avulla muodostuu suunnikkaan pinta-ala $(\det A \neq 0)$ , mikä tarkoittaa, että vektorit ovat lineaarisesti riippumattomia.

Esimerkki. Lineaarinen riippuvuus.

Ovatko vektorit $\ve{v}_1= \begin{bmatrix} -1 \\ 3 \end{bmatrix}$ ja $\ve{v}_2= \begin{bmatrix} 3 \\ -9 \end{bmatrix}$ lineaarisesti riippumattomat?

Ratkaisu. Vektori $\ve{v}_2$ voidaan esittää vektorin $\ve{v}_1$ lineaarikombinaationa eli $\ve{v}_2=-3\ve{v}_1$ . Näin ollen vektorit $\ve{v}_1$ ja $\ve{v}_2$ ovat lineaarisesti riippuvat.

Lineaarinen riippuvuus voidaan todeta myös determinantin $\det A=0$ avulla,

$\det \begin{bmatrix} -1 &3 \\ 3 &-9 \end{bmatrix} = 9-9=0.$

$\begin{tikzpicture}[scale=0.5] % (y, x, z) \coordinate (P1) at (-1,3); \coordinate (P2) at (3,-9); \coordinate (O) at (0,0); %akselit \draw[help lines, color=gray!30, dashed] (-1.9,-9.9) grid (3.9,3.9); \draw[->, color=black!50] (-2,0)--(4,0) node[right]{$x$}; \draw[->, color=black!50] (0,-10)--(0,4) node[above]{$y$}; %akselit \draw[->, red, thick] (O)--(P1) node[midway, left]{$\vec{v}_1$}; \draw[->, blue, thick] (O)--(P2) node[midway, left]{$\vec{v}_2$}; \end{tikzpicture}$

Vektorit osuvat samalle suoralle, jolloin ne ovat lineaarisesti riippuvia eli toinen on toisen lineaarikombinaatio. (Pinta-alallista suunnikasta ei muodostu, $\det A = 0$ .)

# lineaarikuvaus

Lineaarikuvaus ja matriisit

Lineaarikuvaus

Olkoot $V = \mathbb{R}^n$ ja $W = \mathbb{R}^m$ vektoriavaruuksia. Funktio $T: V \rightarrow W$ on lineaarikuvaus, jos

$T(\ve{v}+\ve{u})=T\ve{v}+T\ve{u} \text{ kaikille } \ve{v}, \ve{u} \in V$
$T(c\ve{v}) = cT(\ve{v}) \text{ kaikille } \ve{v} \in V \text{ ja kaikille } c \in \mathbb{R}.$

Jokaiselle lineaarikuvaukselle $T: \mathbb{R}^n \to \mathbb{R}^m$ on olemassa yksikäsitteinen matriisi siten, että kuvaus vastaa matriisilla kertomista, eli $T(\ve{x})=A\ve{x}$ .

Mikä tällainen matriisi sitten on? Matriisin sarakevektorit ovat kuvauksen määrittelyjoukon standardikannan kuvavektorit. Esimerkiksi kuvausta $T:\mathbb{R}^3 \to \mathbb{R}^2$ vastaa $2\times 3$ -matriisi $A_{2\times 3}=\begin{bmatrix} T(\hat i)& T(\hat j)& T(\hat k)\end{bmatrix}$ .

Matriisin koko voidaan perustella siten, että rivejä on kappaletta, koska kuvavektoreilla on komponenttia. Sarakkeita on kappaletta, koska määrittelyjoukossa on kantavektoria.

Yleisesti kuvausta $T: \mathbb R^n \to \mathbb R^m$ vastaava matriisi on $A_{m\times n}=\begin{bmatrix} T(\ve{e}_1)& T(\ve{e}_2)& \dots& T(\ve{e}_n)\end{bmatrix}$ .

Esimerkki. Lineaarikuvaus $T: \mathbb{R}^3 \rightarrow \mathbb{R}^2$ .

Olkoon $T: \mathbb{R}^3 \rightarrow \mathbb{R}^2$ lineaarikuvaus, jolle

$\begin{align*} T(\ve{e}_1)&=T(1,\, 0,\, 0)=({-4},\, {-1}), \\ T(\ve{e}_2)&=T(0,\, 1,\, 0)=( \magenta 1,\, \magenta7) \text{ ja} \\ T(\ve{e}_3)&=T(0,\, 0,\, 1)=(\gray 5,\, \gray{-1}). \end{align*}$ Merkitään

$A = \begin{bmatrix} {-4} &\magenta 1 &\gray 5 \\ {-1} & \magenta 7 &\gray{-1} \end{bmatrix}.$

Nyt $T(\ve{x})=A\ve{x}$ kaikille $\ve{x} \in \mathbb{R}^3$ . Esimerkiksi

$\begin{align*} \red{\ve{w}_1}&=T(\red{\ve{v}_1})= T(\red{-3, \, 0,\, -2}) \\&= \begin{bmatrix} {-4} &1 &5 \\ {-1} &7 &{-1} \end{bmatrix}. \begin{bmatrix} -3 \\ 0 \\ -2 \end{bmatrix} = \begin{bmatrix} \red 2 \\ \red 5 \end{bmatrix}. \end{align*}$

$\begin{align*} \blue{\ve{w}_2}&=T(\blue{\ve{v}_2}) = T(\blue{2, \, 1,\, 1}) \\&= \begin{bmatrix} {-4} &1 &5 \\ {-1} &7 &{-1} \end{bmatrix}. \begin{bmatrix} 2 \\ 1 \\ 1 \end{bmatrix} = \begin{bmatrix} \blue{-2} \\ \blue 4 \end{bmatrix}. \end{align*}$

$\begin{align*} \green{\ve{w}_3}&=T(\green{\ve{v}_3}) = T(\green{0, \, -1,\, -1}) \\&= \begin{bmatrix} {-4} &1 &5 \\ {-1} &7 &{-1} \end{bmatrix}. \begin{bmatrix} 0 \\ -1 \\ -1 \end{bmatrix} = \begin{bmatrix} \green{-6} \\ \green{-6} \end{bmatrix}. \end{align*}$

Alla olevissa kuvissa on esitetty vektorit $\red{\ve{v}_1}$ , $\blue{\ve{v}_2}$ ja $\green{\ve{v}_3}$ $\mathbb{R}^3$ :ssa ja miten ne kuvautuvat vektoreiksi $\red{\ve{w}_1}$ , $\blue{\ve{w}_2}$ ja $\green{\ve{w}_3}$ $\mathbb{R}^2$ :ssa.

# geo3

Voit pyörittää ja zoomata yllä olevaa kuvaa, jotta hahmotat paremmin vektoreiden sijainnit.

$\begin{tikzpicture}[scale=0.5] % (y, x, z) \coordinate (P1) at (2,5); \coordinate (P2) at (-2, -4); \coordinate (P3) at (-6, 6); \coordinate (O) at (0,0); %akselit \draw[help lines, color=gray!30, dashed] (-6.9,-4.9) grid (6.9,6.9); \draw[->, color=black!50] (-7,0)--(7,0) node[right]{$x$}; \draw[->, color=black!50] (0,-5)--(0,7) node[above]{$y$}; %akselit % Piirretään ala %\filldraw[black!50, fill=gray!15] (P1)--(P3)--(P2)--(P1); % % piirretään vektorit \draw[->, red, thick] (O)--(P1) node[above]{$\vec{w}_1$}; \draw[->, blue, thick] (O)--(P2) node[below]{$\vec{w}_2$}; \draw[->, green!70!black, thick] (O)--(P3) node[above]{$\vec{w}_3$}; % \end{tikzpicture}$

# ortogonaalisuus

Ortogonaalisuus, ortonormaalius ja kanta

Ortogonaalisuus ja ortonormaalius.

Joukko $\{ \ve{v}_1, \,\dots, \ve{v}_k \}$ avaruuden $\mathbb{R}^n$ vektoreita on

ortogonaalinen, jos $\ve{v}_i \cdot \ve{v}_j = 0$ aina kun $i \neq j$ . $\quad$ (Kohtisuoruus)
ortonormaali, jos se on ortogonaalinen ja lisäksi $| \ve{v}_i | =1$ kaikilla $i = 1,\, \dots,\, k$ . (Vektorin pituus = 1)

$\begin{tikzpicture}[scale=1] % (y, z, x) \coordinate (P1) at (0,0,2); \coordinate (P2) at (3,0, 0); \coordinate (P3) at (0,1.5,0); \coordinate (O) at (0,0,0); %akselit \draw[->, color=black!50] (0,0,-1.4)--(0,0,3) node[below]{$x$}; \draw[->, color=black!50] (-1,0,0)--(3.5,0,0) node[right]{$y$}; \draw[->, color=black!50] (0,-1,0)--(0,2,0) node[above]{$z$}; %akselit % Piirretään ala %\filldraw[black!50, fill=gray!15] (P1)--(P2)--(P3)--cycle; % % piirretään vektorit \draw[->, red, ultra thick] (O)--(P1) node[midway, below]{$\vec{v}_1$}; \draw[->, blue, ultra thick] (O)--(P2) node[midway, below]{$\vec{v}_2$}; \draw[->, orange, ultra thick] (O)--(P3) node[midway, left, ]{$\vec{v}_3$}; % \end{tikzpicture}$

Kuvan vektorit $\{\ve{v}_1, \, \ve{v}_2, \, \ve{v}_3\}$ ovat ortogonaalisia, mutta eivät ortonormaaleja.

Kanta: standardikanta ja lineaarinen verho

Olkoon $V \subset \mathbb{R}^n$ aliavaruus. Vektorit $\{ \ve{v}_1, \,\dots, \ve{v}_k\}$ muodostavat aliavaruuden kannan, jos

on vektorien lineaarinen verho: $V= \langle \ve{v}_1,\, \dots, \ve{v}_k \rangle$ . Toisin sanoen jokainen $V\text{:n}$ vektori voidaan kirjoittaa vektorien $\ve{v}_1,\, \dots, \ve{v}_k$ lineaarikombinaationa.
$\ve{v}_1, \, \dots, \ve{v}_k$ ovat lineaarisesti riippumattomat.

Tutuin kanta on ns. standardikanta, esimerkiksi $\mathbb{R}^3$ :n standardikanta on $\begin{align*}\{\ve{e}_1, \ve{e}_2, \ve{e}_3\} &= \{(1, \,0, \,0),\, (0,\, 1,\, 0),\, (0,\, 0,\, 1) \} \\&= \{\hat i,\, \hat j,\, \hat k\}.\end{align*}$

Standardikanta on ortogonaalinen eli kantavektorit ovat kohtisuorassa toisiaan vasten ja ortonormaali eli ortogonaalisuuden lisäksi kantavektoreiden pituus on 1. Kantavektoreiden avulla viritetään koko avaruus $\mathbb{R}^3$ .

$\begin{tikzpicture}[scale=1] % (y, z, x) \coordinate (P1) at (0,0,1); \coordinate (P2) at (1,0, 0); \coordinate (P3) at (0,1,0); \coordinate (O) at (0,0,0); %akselit \draw[->, color=black!50] (0,0,-1.4)--(0,0,1.8) node[below]{$x$}; \draw[->, color=black!50] (-1,0,0)--(1.5,0,0) node[right]{$y$}; \draw[->, color=black!50] (0,-1,0)--(0,1.5,0) node[above]{$z$}; %akselit % Piirretään ala %\filldraw[black!50, fill=gray!15] (P1)--(P2)--(P3)--cycle; % % piirretään vektorit \draw[->, red, ultra thick] (O)--(P1) node[midway, below]{$\vec{e}_1$}; \draw[->, blue, ultra thick] (O)--(P2) node[midway, below]{$\vec{e}_2$}; \draw[->, orange, ultra thick] (O)--(P3) node[midway, left, ]{$\vec{e}_3$}; % \end{tikzpicture}$

# gram

Gramin ja Schmidtin ortonormalisointi

Menetelmä. Gramin ja Schmidtin ortonormalisointi.

Olkoon $\{\ve{v}_1, \,\dots, \,\ve{v}_k \}$ aliavaruuden $V \in \mathbb{R}^n$ jokin kanta. Määritellään vektorit $\ve{w}_1, \, \dots, \, \ve{w}_k$ seuraavasti: $\begin{align*} \ve{w}_1 &= \ve{v}_1\\ \ve{w}_2 &= \ve{v}_2-\frac{\ve{v}_2\cdot \ve{w}_1}{\lVert{\ve{w}_1}\rVert^2}\ve{w}_1\\ \ve{w}_3 &= \ve{v}_3-\frac{\ve{v}_3\cdot \ve{w}_1}{\lVert{\ve{w}_1}\rVert^2}\ve{w}_1-\frac{\ve{v}_3\cdot \ve{w}_2}{\lVert{\ve{w}_2}\rVert^2}\ve{w}_2\\ &\vdots \\ \ve{w}_1 &= \ve{v}_k-\sum_{i=1}^{k-1}\frac{\ve{v}_k\cdot \ve{w}_i}{\lVert{\ve{w}_i}\rVert^2}\ve{w}_i.\\ \end{align*}$ Tällöin $\{\ve{w}_1, \, \ve{w}_2, \, \dots, \, \ve{w}_k\}$ on aliavaruuden ortogonaalinen kanta ja $\left\{\frac{\ve{w}_1}{\lVert \ve{w}_1 \rVert},\, \dots, \,\frac{\ve{w}_k}{\lVert \ve{w}_k \rVert} \right\}$ sen ortonormaali kanta.

Huomautus. Yllä oleva lauseke $\frac{\ve{v}_k\cdot \ve{w}_i}{\lVert{\ve{w}_i}\rVert^2}\ve{w}_i$ on vektorin v_k projektio vektorin $\ve{w}$ suhteen.

Heuristinen tulkinta.

Gramin ja Schmidtin ortonormalisointimenetelmällä saadaan mistä tahansa kannasta muodostettua ortonormaali kanta.

Tarkastellaan kolmiulotteisesssa avaruudessa kolmea vektoria, jotka muodostavat tämän avaruuden kannan, mutta jotka eivät ole kohtisuorassa toisiaan vasten. Tämä kanta ei siis ole ortogonaalinen. Ortogonaalinen kanta saadaan seuraavasti:

Otetaan ensimmäinen ei-ortogonaalisen kannan vektori ja määritetään se uuden ortogonaalisen kannan ensimmäiseksi kantavektoriksi.
Vähennetään ei-ortogonaalisen kannan toisesta kantavektorista sen projektio ortogonaalisen kannan ensimmäiselle kantavektorille, jolloin jäljelle jää vain ensimmäistä kantavektoria vastaan kohtisuora osa. Näin saadusta vektorista tulee ortogonaalisen kannan toinen kantavektori.
Toistetaan edellinen vaihe ei-ortogonaalisen kannan kolmannelle kantavektorille ja lisäksi vähennetään siitä sen projektio ortogonaalisen kannan toiselle kantavektorille, jolloin jäljelle jää myös toista kantavektoria vastaan kohtisuora osa. Näin saadusta vektorista tulee ortogonaalisen kannan kolmas kantavektori.

Nämä vektorit muodostavat siis ortogonaalisen kannan ja siitä saadaan ortonormaali jakamalla vektorit niiden pituuksillaan.

Esimerkki. Ortonormaali kanta GS-ortonormalisoinnilla ja geometrinen tulkinta.

Olkoon lineaarisesti riippumattomat vektorit $\ve{v}_1 = (1, \, -1, \, 1)$ , $\ve{v}_2 = (1, \, 0, \, 1)$ ja $\ve{v}_3 = (1, \, 1, \, 2)$ . Koska vektorit $\ve{v}_1, \ve{v}_2, \ve{v}_3$ ovat lineaarisesti riippumattomia, niin ne virittävät kolmiulotteisen avaruuden $\mathbb{R}^3$ ja ne muodostavat sen kannan. Tämä kanta ei kuitenkaan ole ortogonaalinen.

Muodostetaan Gramin ja Schmidtin ortonormalisointi-menetelmällä tästä kannasta ortonormaali kanta avaruudelle $\mathbb{R}^3$ .

Valitaan $\begin{align*} \ve{w}_1&=\ve{v}_1=(1, \, -1, \, 1) \\ \ve{w}_2 &= \ve{v}_2-\frac{\ve{v}_2\cdot \ve{w}_1}{\lVert{\ve{w}_1}\rVert^2}\ve{w}_1\\ &=(1, \, 0, \, 1) -\frac{(1, \, 0, \, 1) \cdot (1, \, -1, \, 1)}{1^2+(-1)^2+1^2}\cdot (1, \, -1, \, 1)\\ &=(1, \, 0, \, 1) -\frac{(1\cdot 1+0\cdot (-1) + 1\cdot 1)}{3}\cdot (1, \, -1, \, 1)\\ &=(1, \, 0, \, 1) - \frac{2}{3}\cdot(1, \, -1, \, 1) =\left(\frac{1}{3}, \, \frac{2}{3}, \frac{1}{3}\right)\\ \ve{w}_3 &= \ve{v}_3-\frac{\ve{v}_3\cdot \ve{w}_1}{\lVert{\ve{w}_1}\rVert^2}\ve{w}_1-\frac{\ve{v}_3\cdot \ve{w}_2}{\lVert{\ve{w}_2}\rVert^2}\ve{w}_2\\ &= (1, \, 1, \, 2) - \frac{(1, \, 1, \, 2) \cdot (1,\,-1,\,1)}{{1}^2+{(-1)}^2+{1}^2}\cdot (1,\,-1\,,1)\\ &\quad \ -\frac{(1, \, 1, \, 2) \cdot \left(\frac{1}{3}, \, \frac{2}{3}, \frac{1}{3}\right)}{{\frac{1}{3}}^2+{\frac{2}{3}}^2+{\frac{1}{3}}^2}\cdot \left(\frac{1}{3}, \, \frac{2}{3}, \frac{1}{3}\right)\\ &= (1, \, 1, \, 2) - \left(\frac{2}{3},\,-\frac{2}{3},\,\frac{2}{3}\right) - \left(\frac{5}{3} \cdot \frac{3}{2} \right) \cdot \left(\frac{1}{3}, \, \frac{2}{3}, \frac{1}{3}\right)\\ &= \dots = \left(-\frac{1}{2}, \,0,\, \frac{1}{2}\right).\\ \end{align*}$ Saatu kanta $\{\ve{w}_1, \, \ve{w}_2, \, \ve{w}_3\}=\{(1,\,-1,\,1), \, \left(\frac{1}{3}, \, \frac{2}{3}, \frac{1}{3}\right), \,\left(-\frac{1}{2}, \,0,\, \frac{1}{2}\right)\}$ on ortogonaalinen. Ortonormaali kanta saadaan, kun jaetaan vektorit niiden pituudella, toisin sanoen tehdään niistä ykkösen pituisia:

$\begin{align*} \frac{\ve{w}_1}{\lVert \ve{w}_1 \rVert}&=\frac{1}{\sqrt{3}}(1,\,-1,\,1)\\ \frac{\ve{w}_2}{\lVert \ve{w}_2 \rVert}&=\frac{\sqrt{3}}{\sqrt{2}}\left(\frac{1}{3}, \, \frac{2}{3}, \frac{1}{3}\right)=\frac{1}{\sqrt{6}}\left(1, \, 2, 1\right)\\ \frac{\ve{w}_3}{\lVert \ve{w}_3 \rVert}&=\sqrt{2}\left(-\frac{1}{2}, \,0,\, \frac{1}{2}\right)=\frac{1}{\sqrt{2}}\left(-1, \,0,\, 1\right)\\ \end{align*}$

$\begin{tikzpicture} % xyz = yzx %3d-akselit \draw[->] (xyz cs:x=-1.5) -- (xyz cs:x=1.4) node[right] {$y$}; \draw[->] (xyz cs:y=-0.5) -- (xyz cs:y=2.0) node[above] {$z$}; \draw[->] (xyz cs:z=-1.5) -- (xyz cs:z=1.5) node[below] {$x$}; %3d-akselit loppuu % piirretään alkuperäinen tilanne \draw[->, thick, red] (0,0,0)--(-1,1,1) node[above]{$v_1$}; \draw[->, thick, blue] (0,0,0)--(0,1,1) node[above]{$v_2$}; \draw[->, thick, magenta] (0,0,0)--(1,2,1) node[above]{$v_3$}; \draw[-, blue, dashed] (0,1,1)--(0,0,1); \draw[-, blue, dashed] (0,1,0)--(0,1,1); \draw[-, red, dashed] (-1,0,1)--(0,0,0); \draw[-, red, dashed] (-1,1,1)--(-1,0,1); \draw[-, magenta, dashed] (1,2,1)--(1,0,1); \draw[-, magenta, dashed] (1,0,1)--(0,0,0); \end{tikzpicture} \begin{tikzpicture} % piirretään nuoli keskelle \draw[ultra thick, ->] (0,2) arc (135:45:1) node[midway, above]{\text{GS-menetelmä}}; \draw[] (0,0)++(1.5,0) ; \end{tikzpicture} \begin{tikzpicture} % xyz = yzx %3d-akselit \draw[->] (xyz cs:x=-1.5) -- (xyz cs:x=1.6) node[right] {$y$}; \draw[->] (xyz cs:y=-0.5) -- (xyz cs:y=2.0) node[above] {$z$}; \draw[->] (xyz cs:z=-1.5) -- (xyz cs:z=1.5) node[below] {$x$}; %3d-akselit loppuu % piirretään lopputilanne ortogonaalinen \draw[->, thick, red] (0,0,0)--(-1,1,1) node[above]{$v_1=w_1$}; \draw[->, thick, blue] (0,0,0)--(2,1,1) node[above]{$w_2$}; \draw[->, thick, magenta] (0,0,0)--(0,1,-1) node[above]{$w_3$}; \draw[-, blue, dashed] (2,1,1)--(2,0,1); \draw[-, blue, dashed] (0,0,0)--(2,0,1); \draw[-, red, dashed] (-1,0,1)--(0,0,0); \draw[-, red, dashed] (-1,1,1)--(-1,0,1); \draw[-, magenta, dashed] (0,1,-1)--(0,0,-1); \draw[-, magenta, dashed] (0,1,-1)--(0,1,0); % piirretään lopputilanne normitettu \draw[->, ultra thick, red] (0,0,0)--(-1/3^0.5,1/3^0.5,1/3^0.5) node[above]{}; \draw[->, ultra thick, blue] (0,0,0)--(2/6^0.5,1/6^0.5,1/6^0.5) node[above]{}; \draw[->, ultra thick, magenta] (0,0,0)--(0,1/2^0.5,-1/2^0.5) node[above]{}; \end{tikzpicture}$

Vasemmalla puolella on kuvattu tilanne jossa vektorit $\ve{v}_1, \ve{v}_2, \ve{v}_3$ muodostavat avaruuden $\mathbb{R}^3$ kannan. Kuvasta nähdään, että vektorit eivät ole ortogonaalisia tai yksikkövektoreita.

GS-menetelmällä saatu ortonormaali kanta on esitetty oikealla puolella. Vektorit $\ve{w_1}$ , $\ve{w_2}$ ja $\ve{w_3}$ ovat nyt kohtisuorassa toisiaan vastaan ja ne on normitettu (lihavoidut nuolet).

# ominaisarvot

Ominaisarvot ja -vektorit

Reaaliluku $\lambda$ on neliömatriisin $A_{n\times n}$ ominaisarvo, jos on olemassa ominaisvektori $\ve{x}$ siten, että $A\ve{x}=\lambda \ve{x}.$

Nollavektori $\ve{0}$ ei ole ominaisvektori, vaikka sille pätee $A\ve{0}=\lambda\ve{0}$ .

Myös vakiolla $c\ne0$ kerrottu ominaisvektori $c\ve{x}$ on ominaisvektori, sillä $A(c\ve{x}) = c(A\ve{x})=c(\lambda\ve{x})=\lambda(c\ve{x}).$

Yhtälö $A\ve{x}=\lambda \ve{x}$ voidaan kirjoittaa yhtäpitävästi muodossa $A\ve{x}=\lambda I \ve{x}$ tai $(\lambda I -A) \ve{x}= \ve{0},$ missä on yksikkömatriisi.

Esimerkki. Ominaisarvon toteaminen ja geometrinen tulkinta.

Vektori $\ve{x} = (4,\, 1) = \begin{bmatrix} 4 \\ 1 \end{bmatrix}$ on matriisin $A= \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix}$ ominaisarvoa 2 vastaava ominaisvektori, sillä $\begin{align*} A\ve{x}&= \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix} \begin{bmatrix} 4 \\ 1 \end{bmatrix} = \begin{bmatrix} 1\cdot 4 +4\cdot 1 \\ -1\cdot 4 +6\cdot 1 \end{bmatrix} \\&= \begin{bmatrix} 8 \\ 2 \end{bmatrix} =2 \begin{bmatrix} 4 \\ 1 \end{bmatrix} = 2 \cdot \ve{x}. \end{align*}$

Puolestaan vektori $\ve{y} = (-2,\, 1) = \begin{bmatrix} -2 \\ 1 \end{bmatrix}$ ei ole matriisin $A= \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix}$ ominaisvektori, sillä $\begin{align*} A\ve{y}&= \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix} \begin{bmatrix} -2 \\ 1 \end{bmatrix} \\&= \begin{bmatrix} 1\cdot(-2) +4\cdot1 \\ -1\cdot(-2) +6\cdot1 \end{bmatrix} \\&= \begin{bmatrix} 2 \\ 8 \end{bmatrix} \neq \lambda \begin{bmatrix} -2 \\ 1 \end{bmatrix} = \lambda \cdot \ve{y}. \end{align*}$ Ei siis ole olemassa lukua $\lambda$ , jolla yhtälö $A\ve{y}=\lambda\ve{y}$ toteutuu.

$\begin{tikzpicture}[scale=1.0] \begin{axis}[axis lines = middle, domain= -2:5, restrict y to domain = -9:8] \addplot [->, thick, red] coordinates { (0,0) (4,1)} node[midway, above]{$\vec{x}$}; \addplot [->, thick, blue] coordinates { (0,0) (-2,1)} node[midway, above]{$\vec{y}$}; \addplot [->, thick, black] coordinates { (4,1) (8,2)} node[midway, above]{$A\vec{x}$}; \addplot [->, thick, magenta] coordinates { (0,0) (2,8)} node[midway, right]{$A\vec{y}$};; \addplot [-, black] coordinates { (0,-2) (0,3)}; \addplot [-, black] coordinates { (-3,0) (5,0)}; \end{axis} \end{tikzpicture}$

Yllä olevasta kuvasta nähdään, että kun matriisilla operoidaan vektoria $\ve{x}$ , joka on sen ominaisvektori, niin saadaan uusi vektori, joka on samansuuntainen vektorin $\ve{x}$ kanssa, mutta kaksi kertaa pidempi $A\ve{x}=2\cdot\ve{x}$ . Matriisi on siis skaalannut tätä vektoria ominaisarvon verran.

Jos puolestaan matriisilla operoidaan vektoria $\ve{y}$ , joka ei ole sen ominaisvektori, niin saatu tulovektori ei ole samansuuntainen vektorin $\ve{y}$ kanssa. Matriisi on siis kiertänyt tätä vektoria.

Tämä on ominaisarvojen ja vektoreiden geometrinen tulkinta.

Matriisin ominaisvektorit ovat siis ne vektorit, jotka vain skaalautuvat eli säilyttävät suuntansa, kun niitä operoidaan matriisilla . Ominaisarvot puolestaan kertovat kuinka paljon ominaisvektoreita on skaalattu.

Karakteristinen yhtälö ja polynomi

Ominaisarvot voidaan ratkaista karakteristisen polynomin $\det (\lambda I - A)$ avulla. Reaaliluku $\lambda$ on matriisin ominaisarvo jos ja vain jos $\det (\lambda I - A)=0.$

Mikä ihmeen karakteristinen yhtälö?

Ominaisarvo-ongelma on yleisesti $A\ve x = \lambda \ve x,$ missä on neliömatriisi, $\ve x$ on vektori ja $\lambda$ on vakio. Matriisissa on yhtä monta riviä (ja samalla saraketta) kuin vektorissa on komponentteja.

Etsitään yhtälöä muokkaamalla ongelman karakteristinen yhtälö. Jokaiselle matriisille (ja siten myös vektorille $\ve x$ ) löytyy sopivan kokoinen yksikkömatriisi , jolle $\ve x = I\ve x.$ Sijoittamalla tämä ominaisarvo-ongelmaan saadaan $\begin{aligned} A\ve x &= \lambda (I\ve x),\, \text{eli}\\ A\ve x &= (\lambda I)\ve x. \end{aligned}$ Nyt vähentämällä puolittain yhtälön vasen puoli saadaan $(\lambda I)\ve x-A\ve x=(\lambda I- A)\ve x=\ve 0.$ Tähän voidaan käyttää tietoa matriisin kääntyvyyden ja determinantin yhteydestä. Jos matriisi $(\lambda I-A)$ olisi kääntyvä, voisimme kertoa yhtälön puolittain käänteismatriisilla, ja saataisiin $I\ve x = \ve x = 0.$

Ominaisarvo-ongelmalle halutaan kuitenkin ratkaisuja, joille $\ve x \ne 0,$ joten matriisi $(\lambda I-A)$ ei saa olla kääntyvä. Tiedetään, että tämä on totta jos ja vain jos $\det(\lambda I -A) = 0.$ Tämä on ongelman karakteristinen yhtälö.

Joskus tämä kirjoitetaan muodossa $\det(A-\lambda I)=0.$

Yllä olevaa yhtälöä kutsutaan karakteristiseksi yhtälöksi ja se on astetta oleva polynomiyhtälö, jolla on aina ratkaisua (myös kompleksiset ratkaisut ja ratkaisujen kertaluvut huomioiden) eli se voidaan kirjoittaa muodossa $\det (\lambda I - A)= (\lambda - \lambda_1)(\lambda - \lambda_1)\cdots (\lambda - \lambda_n),$ missä $\lambda_1,\, \lambda_2, \, \dots, \, \lambda_n$ ovat matriisin ominaisarvot.

Esimerkki. Ominaisarvojen laskeminen.

Lasketaan karakteristisen yhtälön $\det (\lambda I -A)=0$ avulla matriisin $A= \begin{bmatrix} 1 &4 \\ -1 &6 \end{bmatrix}$ ominaisarvot.

Lasketaan matriisi $\lambda I - A$ :

$\begin{align*} \lambda I - A &= \lambda \begin{bmatrix} 1 &0 \\ 0 &1 \end{bmatrix}- \begin{bmatrix} 1 &4 \\ -1 &6 \end{bmatrix} \\&= \begin{bmatrix} \lambda &0 \\ 0 &\lambda \end{bmatrix}- \begin{bmatrix} 1 &4 \\ -1 &6 \end{bmatrix} \\&= \begin{bmatrix} \lambda -1 &-4 \\ 1 &\lambda-6 \end{bmatrix} \end{align*}$

jolloin $\det (\lambda I - A)= (\lambda-1)(\lambda-6)+4$ .

Nyt karakteristinen yhtälö antaa $\begin{align*} \det (\lambda I - A)= 0 \\ \Leftrightarrow (\lambda-1)(\lambda-6)+4=0\\ \Leftrightarrow \lambda^2-7\lambda +10=0\\ \Leftrightarrow \lambda=2 \text{ tai } \lambda=5. \end{align*}$

Matriisin ominaisarvot ovat siis 2 ja 5.

Muista, että karakteristisella polynomilla on kertaluvut ja kompleksiset ratkaisut huomioon ottaen aina täsmälleen ratkaisua. Tässä karakteristinen yhtälö on toisen asteen polynomi, joten sillä on täsmälleen 2 ratkaisua.

Esimerkki. Ominaisvektorien etsiminen.

Aiemmin saatiin selville, että matriisin $A= \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix}$ ominaisarvot ovat 2 ja 5. Etsitään seuraavaksi niitä vastaavat ominaisvektorit.

Selvitetään kummallekin ominaisarvolle $\lambda_1 = 2$ ja $\lambda_2 = 5$ , mitkä vektorit toteuttavat yhtälön $(\lambda I - A) \ve{x} = 0$ . Aiemmin laskettiin matriisille $(\lambda I - A)= \begin{bmatrix} \lambda -1 &-4 \\ 1 &\lambda-6 \end{bmatrix}$ .

Tarkastellaan ensin tapaus $\lambda_1 = 2$ : $\begin{align*} (2 I - A) \ve{x} &= \ve{0} \\ \Leftrightarrow \begin{bmatrix} 2 -1 &-4 \\ 1 &2-6 \end{bmatrix} \begin{bmatrix} x_1\\ x_2 \end{bmatrix}&= \begin{bmatrix} 0\\ 0 \end{bmatrix}\\ \Leftrightarrow \begin{bmatrix} 1 &-4 \\ 1 &-4 \end{bmatrix} \begin{bmatrix} x_1\\ x_2 \end{bmatrix}&= \begin{bmatrix} 0\\ 0 \end{bmatrix}\\ \Leftrightarrow \begin{bmatrix} x_1-4x_2\\ x_1-4x_2 \end{bmatrix}&= \begin{bmatrix} 0\\ 0 \end{bmatrix}\\ \Leftrightarrow x_1&=4x_2. \end{align*}$

Yhtälön $(2 I - A) \ve{x} = 0$ toteuttaa siis kaikki muotoa $\ve{x}=(4x_2,\, x_2)$ olevat vektorit ja esimerkiksi tuo aikaisemmassa esimerkissä oleva vektori $\ve{x}=(4, \, 1)$ .

Tarkastellaan sitten tapaus $\lambda_1 = 5$ : $\begin{align*} (5 I - A) \ve{x} &= \ve{0} \\ \Leftrightarrow \begin{bmatrix} 5 -1 &-4 \\ 1 &5-6 \end{bmatrix} \begin{bmatrix} x_1\\ x_2 \end{bmatrix}&= \begin{bmatrix} 0\\ 0 \end{bmatrix}\\ \Leftrightarrow \begin{bmatrix} 4 &-4 \\ 1 &-1 \end{bmatrix} \begin{bmatrix} x_1\\ x_2 \end{bmatrix}&= \begin{bmatrix} 0\\ 0 \end{bmatrix}\\ \Leftrightarrow \begin{bmatrix} 4x_1-4x_2\\ x_1-x_2 \end{bmatrix}&= \begin{bmatrix} 0\\ 0 \end{bmatrix}\\ \Leftrightarrow x_1&=x_2. \end{align*}$

Yhtälön $(5 I - A) \ve{x} = 0$ toteuttaa siis kaikki muotoa $\ve{x}=(x_1,\, x_1)$ olevat vektorit ja esimerkiksi vektori $\ve{x}=(1, \, 1)$ .

# diagonalisointi

Neliömatriisin diagonalisointi

Neliömatriisi $A=A_{n \times n}$ on diagonalisoituva, jos on olemassa kääntyvä $(n \times n)$ -neliömatriisi siten, että $\begin{align*} U^{-1}AU = D, \end{align*}$ missä $D= \operatorname{diag}(\lambda_1, \, \lambda_2,\, \dots, \, \lambda_n )$ . Tällöin $\lambda_1, \, \lambda_2, \dots,\, \lambda_n$ ovat matriisin ominaisarvot ja matriisin sarakkeina ovat matriisin ominaisvektorit.

Huomautus. Tämä voidaan myös esittää muodossa

$A = UDU^{-1}.$

Esimerkki. Neliömatriisin diagonalisointi.

Aiemmin saatiin selville, että matriisin $A= \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix}$ ominaisarvot ovat $\lambda_1=2$ ja $\lambda_2=5$ . Lisäksi niille löydettiin vastaavat ominaisvektorit $\ve{x}_1=(\red 4,\,\red 1)$ ja $\ve{x}_2=(1,\,1)$ .

Matriisi on siis muotoa $U = \begin{bmatrix} \red 4 &1 \\ \red 1 &1 \end{bmatrix}, \quad \text{jolloin} \quad U^{-1}=\frac{1}{3} \begin{bmatrix} 1 &-1 \\ -1 &4 \end{bmatrix}.$

Nyt suora lasku antaa $\begin{align*} U^{-1}AU &=\frac{1}{3} \begin{bmatrix} 1 &-1 \\ -1 &4 \end{bmatrix} \cdot \begin{bmatrix} 1 &4\\ -1 &6 \end{bmatrix} \cdot \begin{bmatrix} 4 &1 \\ 1 &1 \end{bmatrix}\\ &=\frac{1}{3}\cdot \begin{bmatrix} 2 &-2 \\ -5 &20 \end{bmatrix} \cdot \begin{bmatrix} 4 &1 \\ 1 &1 \end{bmatrix}\\ &=\frac{1}{3} \cdot \begin{bmatrix} 6 &0 \\ 0 &15 \end{bmatrix} = \begin{bmatrix} 2 &0 \\ 0 &5 \end{bmatrix}, \end{align*}$

joka on diagonaalimatriisi $D=\operatorname{diag}(\lambda_1, \, \lambda_2)=\operatorname{diag}(2,\, 5)$ .

# lohkomuodot

Matriisien lohkomuodot

Matriisi $A_{m \times n}$ voidaan esittää lohkomuodossa $\begin{align*} A = \begin{bmatrix} A_{11} &A_{12} & \cdots &A_{1s}\\ A_{21} &A_{22} & \cdots &A_{2s}\\ \vdots &\vdots & \ddots &\vdots\\ A_{r1} &A_{r2} & \cdots &A_{rs} \end{bmatrix}, \end{align*}$ missä lohko $A_{ij}$ on kokoa $m_i \times n_j$ ja $m =m_1 +m_2+ \cdots + m_r$ ja $n =n_1 +n_2+ \cdots + n_s.$

Älä sekoita matriisin lohkoa alimatriisiin, jolla on sama merkintä $A_{ij}.$

Esimerkki. Lohkomatriisi.

Matriisi $A=A_{4 \times 4}$ voidaan jakaa lohkoihin $\begin{align*} A = \begin{bmatrix} \red 3 &\red 5 &\blue 0 &\blue{-5}\\ \red 6 &\red 0 &\blue{-1} &\blue 8\\ \green 2 &\green 4 &9 &0\\ \green 0 &\green 1 &-2 &-1 \end{bmatrix} = \begin{bmatrix} \red{A_{11}} &\blue{A_{12}}\\ \green{A_{21}} &A_{22}\\ \end{bmatrix}, \end{align*}$ missä $\red{A_{11}} = \begin{bmatrix} \red 3 &\red 5\\ \red 6 &\red 0 \end{bmatrix}$ , $\blue{A_{12}} = \begin{bmatrix} \blue 0 &\blue{-5}\\ \blue{-1} &\blue 8 \end{bmatrix}$ , $\green{A_{21}} = \begin{bmatrix} \green 2 &\green 4 \\ \green 0 &\green 1 \end{bmatrix}$ ja $A_{22} = \begin{bmatrix} 9 &0\\ -2 &-1 \end{bmatrix}$ .

Vaikka tässä esimerkissä kaikki lohkot ovat $2\times 2$ -matriiseja, niin matriiseja voidaan lohkottaa myös eri kokoisiksi lohkoiksi tilanteeseen sopivalla tavalla.

Edellisen matriisin voi jakaa myös vaikkapa $4\times3$ - ja $4\times1$ -matriiseiksi: $A = \begin{bmatrix} \red 3 &\red 5 &\red 0 &\blue{-5}\\ \red 6 &\red 0 &\red{-1} &\blue 8\\ \red 2 &\red 4 &\red9 &\blue{0}\\ \red 0 &\red 1 &\red{-2} &\blue{-1} \end{bmatrix}= \begin{bmatrix} \red {A_1}& \blue {A_2}\end{bmatrix}.$

Lohkomatriisien kertolasku

Lohkomatriiseille pätee samat laskusäännöt kuin normaaleille matriiseillekin. Laskutoimitukset voidaan suorittaa lohkoittain. Olkoon $A = \begin{bmatrix} A_{11} &A_{12} &\cdots &A_{1s}\\ A_{21} &A_{22} &\cdots &A_{1s}\\ \vdots &\vdots &\ddots &\vdots\\ A_{r1} &A_{r2} &\cdots &A_{rs} \end{bmatrix}$ ja $B = \begin{bmatrix} B_{11} &B_{12} &\cdots &B_{1t}\\ B_{21} &B_{22} &\cdots &B_{1t}\\ \vdots &\vdots &\ddots &\vdots\\ B_{s1} &B_{s2} &\cdots &B_{st} \end{bmatrix}.$

Nyt matriisien tulon lohko $(AB)_{ij}$ on

$\sum_{l=1}^s A_{il}B_{lj},$

mikäli lohkojen koot ovat yhteensopivia eli kertolasku voidaan suorittaa.

Esimerkki. Lohkomatriisien kertolasku.

Olkoon matriisit $A=A_{3 \times 5}$ ja $B=B_{5 \times 2}$ : $\begin{align*} A = \begin{bmatrix} \red 3 & \red 2 & \red 1 & \blue 2 & \blue 1\\ \red 0 & \red 1 & \red 4 & \blue 1 & \blue 7\\ \green 5 & \green 7 & \green 1 & 6 & 2 \end{bmatrix} &= \begin{bmatrix} \red{A_1} & \blue{A_2}\\ \green{A_3} & A_4 \end{bmatrix},\\ B = \begin{bmatrix} \red 1 & \red 2 \\ \red 0 & \red 1 \\ \red 1 & \red 0 \\ \blue 1 & \blue 0 \\ \blue 1 & \blue 0 \end{bmatrix} &= \begin{bmatrix} \red{B_1}\\ \blue{B_2} \end{bmatrix}. \end{align*}$

Nyt matriisien ja tulo voidaan esittää muodossa: $AB = \begin{bmatrix} \red{A_1} & \blue{A_2}\\ \green{A_3} & A_4 \end{bmatrix} \begin{bmatrix} \red{B_1}\\ \blue{B_2} \end{bmatrix} = \begin{bmatrix} \red{A_1 B_1} + \blue{A_2 B_2}\\ \green{A_3}\red{B_1} + A_4\blue{B_2} \end{bmatrix}.$

Lasketaan tulot: $\red{A_1B_1} = \begin{bmatrix} 3 &2 &1\\ 0 &1 &4 \end{bmatrix} \begin{bmatrix} 1 &2\\ 0 &1 \\ 1 &0 \end{bmatrix} = \begin{bmatrix} \red 4 &\red 8\\ \red 4 &\red 1 \end{bmatrix},$

$\blue{A_2B_2} = \begin{bmatrix} 2 &1\\ 1 &7 \end{bmatrix} \begin{bmatrix} 1 &0\\ 1 &0 \end{bmatrix} = \begin{bmatrix} \red 3 &\red 0\\ \red 8 &\red 0 \end{bmatrix},$

$\green{A_3}\red{B_1} = \begin{bmatrix} 5 &7 &1\\ \end{bmatrix} \begin{bmatrix} 1 &2\\ 0 &1 \\ 1 &0 \end{bmatrix} = \begin{bmatrix} \blue 6 &\blue{17}\\ \end{bmatrix},$

$A_4\blue{B_2} = \begin{bmatrix} 6 &2\\ \end{bmatrix} \begin{bmatrix} 1 &0\\ 1 &0 \end{bmatrix} = \begin{bmatrix} \blue 8 &\blue 0\\ \end{bmatrix}.$

Lopuksi lasketaan lohkot yhteen:

$\red{A_1B_1} + \blue{A_2B_2}= \begin{bmatrix} \red 7 & \red 8\\ \red{12} &\red 1 \end{bmatrix}$ ja $\green{A_3}\red{B_1}+ A_4\blue{B_2} = \begin{bmatrix} \blue{14} & \blue{17} \end{bmatrix}.$

Yhdistetään ja saadaan tulo

$AB = \begin{bmatrix} \red 7 & \red 8 \\ \red{12} & \red 1\\ \blue{14} & \blue{17} \end{bmatrix}.$

# lohkodiagonaalinen

Lohkodiagonaalinen matriisi

Neliömatriisi $D=D_{n \times n}$ on lohkodiagonaalinen, jos sillä on esitys

$\begin{align*} D = \begin{bmatrix} A_{11} &0 &\cdots &0\\ 0 &A_{22} &\ddots &\vdots \\ \vdots &\ddots &\ddots &0 \\ 0 &\cdots &0 &A_{kk} \end{bmatrix}, \end{align*}$

missä kukin $A_{ii}$ on neliömatriisi ja $k \geq 2$ . Tällöin voidaan merkitä $D= \operatorname{diag} (A_{11},\, A_{22},\, \dots,\, A_{kk})$ .

Huomaa, että lohkomatriisit $A_{ij}$ eivät välttämättä ole diagonaalimatriiseja.

Lohkodiagonaaliselle matriisille $D=\operatorname{diag}(A_{11},\, A_{22},\, \dots,\, A_{kk})$ pätee: $\newline$ 1. Potenssit saadaan lohkojen potensseista: $D^n=\operatorname{diag}(A^n_{11}, \, A^n_{22},\, \dots,\, A^n_{kk}).$ $\newline$ 2. on kääntyvä jos ja vain jos jokainen diagonaalilohko $A_{ii}$ on kääntyvä. Tällöin $D^{-1} = \operatorname{diag}(A_{11}^{-1}, \, A_{22}^{-1}, \,\dots,\, A_{kk}^{-1}).$ $\newline$ 3. Determinantti on lohkojen determinanttien tulo: $\det(D)=\det(A_{11})\det(A_{22})\cdots \det(A_{kk}).$

Esimerkki. Lohkodiagonaalisen matriisin determinantin laskeminen.

Neliömatriisi $A=A_{6\times 6}$ on lohkodiagonaalinen seuraavalla lohkojaolla:

$\begin{align*} A= \begin{bmatrix} \red{0} &\red 3 &\red 4 &0 &0 &0\\ \red{2} &\red 1 &\red 5 &0 &0 &0\\ \red 0 &\red{-2} &\red 3 &0 &0 &0\\ 0 &0 &0 &\green 1 &0 &0\\ 0 &0 &0 &0 &\blue{-2} &\blue 6\\ 0 &0 &0 &0 &\blue 2 &\blue{-3} \end{bmatrix} = \begin{bmatrix} \red{A_{11}} &0 &0\\ 0 &\green{A_{22}} &0\\ 0 &0 &\blue{A_{33}} \end{bmatrix}, \end{align*}$

missä $\red{A_{11}}= \red{\begin{bmatrix} 0 &3 &4\\ 2 &1 &5\\ 0 &-2 &3 \end{bmatrix}}$ , $\green{A_{22}} = \green{\begin{bmatrix} 1 \end{bmatrix}}$ ja $\blue{A_{33}} = \blue{\begin{bmatrix} -2 &6\\ 2 &-3 \end{bmatrix}}$ .

Lasketaan lohkojen determinantit. Ensimmäisen lohkon determinantti on helpointa laskea ensimmäisen sarakkeen $\red{\begin{bmatrix}0\\2\\0\end{bmatrix}}$ suhteen, sillä siinä on kaksi nollaa. $\begin{align*} \det (\red{A_{11}})&= \red{\begin{vmatrix} \blue 0 &3 &4\\ \blue 2 & \gray 1 &\gray 5\\ \blue 0 &-2 &3 \end{vmatrix}} \\&= \blue 0 - \blue 2 \cdot \det \red {\begin{vmatrix} 3 &4\\ -2 &3 \end{vmatrix}} + \blue 0 \\&= -2 \cdot (9+8) = -34,\\ \det (\green{A_{22}}) &= 1,\\ \det (\blue{A_{33}}) &= (-2)\cdot (-3)-6\cdot 2 = -6.\end{align*}$

Matriisin determinantti on siis

$\det (A)= (-34)\cdot1 \cdot (-6)= 204.$

Esimerkki. Lohkodiagonaalisen matriisin käänteismatriisi.

Etsi matriisin käänteismatriisi, kun $A= \begin{bmatrix} 8 &3 &0 &0 \\ 3 &1 &0 &0 \\ 0 &0 &0 &-1 \\ 0 &0 &9 &-2 \\ \end{bmatrix}$

Ratkaisu. Jaetaan matriisi sopiviin lohkoihin:

$A= \begin{bmatrix} \red 8 &\red3 &0 &0 \\ \red 3 &\red 1 &0 &0\\ 0 &0 &\blue 0 &\blue{-1}\\ 0 &0 &\blue 9 &\blue{-2}\\ \end{bmatrix} = \begin{bmatrix} \red{A_{11}} &0\\ 0 &\blue{A_{22}}\\ \end{bmatrix}$

Saadaan diagonaalimatriisi, joka on kääntyvä sillä

$\det (\red{A_{11}}) = 8\cdot 1-3\cdot 3 = -1 \neq 0$ ja $\det (\blue{A_{22}}) = 0\cdot (-2)- 1\cdot(-9) = 9 \neq 0.$

Lasketaan diagonaalilohkojen käänteismatriisit:

$\begin{align*} \red{A_{11}^{-1}} &= \frac{1}{\det (A_{11})} \begin{bmatrix} 1 &-3\\ -3 &8 \end{bmatrix} \\&= -1\cdot \begin{bmatrix} 1 &-3\\ -3 &8 \end{bmatrix} = \begin{bmatrix} \red{-1} &\red{3}\\ \red 3 &\red{-8} \end{bmatrix} \end{align*}$ ja $\begin{align*} \blue{A_{22}^{-1}}&= \frac{1}{\det (A_{22})} \begin{bmatrix} -2 &1\\ -9 &0 \end{bmatrix} \\&= \frac{1}{9}\cdot \begin{bmatrix} -2 &1\\ -9 &0 \end{bmatrix} = \begin{bmatrix} \blue{-\frac{2}{9}} &\blue{\frac{1}{9}}\\ \blue{-1} &\blue{0} \end{bmatrix}. \end{align*}$

Siis matriisin käänteismatriisi $A^{-1}$ on $A^{-1}= \begin{bmatrix} \red{-1} &\red{3} &0 &0\\ \red 3 &\red{-8} &0 &0\\ 0 &0 &\blue{-\frac{2}{9}} &\blue{\frac{1}{9}}\\ 0 &0 &\blue{-1} &\blue{0} \end{bmatrix}.$

# kompleksi

Kompleksialkioisia matriiseja

Kompleksialkioisen matriisin $A=(a_{nm})$ alkiot ovat kompleksilukuja $a_{nm}=r_{nm}+i\,s_{nm}.$ Kompleksiarvoisilla matriiseilla operoidaan aivan samoin kuin reaaliarvoisilla. Kompleksiarvoinen matriisi voidaan hajottaa kahdeksi reaaliseksi matriisiksi ottamalla alkioiden reaaliosat $r_{nm}$ ja imaginaariosat $s_{nm}$ erilleen:

A = R + iS, missä $R=(r_{nm})$ ja $S=(s_{nm})$ ovat reaalialkioisia matriiseja.

Matriisin kompleksikonjugaatti voidaan tällöin kirjoittaa

A^* = R -iS .

Esimerkki. Kompleksisten matriisien tulo.

Lasketaan kahden kompleksisen matriisin $A= \begin{bmatrix} 2 +4i &3-2i \\ 5 &i \end{bmatrix}$ ja $B= \begin{bmatrix} 1 &-i \\ 5+2i &i \end{bmatrix}$ tulo

$\begin{align*} AB &= \begin{bmatrix} \red{2+4i} &\blue{3-2i} \\ 5 & \green i \end{bmatrix} \begin{bmatrix} 1 &-i \\ 5+2i &i \end{bmatrix}\\ &= \begin{bmatrix} (\red{2 + 4i})\cdot1 + (\blue{3 - 2i})(5+2i) &(\red{2 + 4i})(-i) +(\blue{3-2i})\cdot i\\ 5\cdot 1 +(\green{i})(5+2i) &5(-i)+(\green{i})\cdot i \end{bmatrix}\\ &= \begin{bmatrix} 2 + 4i+15+6i-10i-4i^2 &-2i-4i^2+3i-2i^2\\ 5+5i+2i^2 &-5i+i^2 \end{bmatrix}\\ &= \begin{bmatrix} 21 &6+i\\ 3+5i &-1-5i \end{bmatrix}. \end{align*}$

# hermitenkonjugaatti

Kompleksialkioisen neliömatriisin $A_{n \times n}$ Hermiten konjugaatti on $A^\dagger = (A^*)^T.$ Hermiten konjugaatti $A^\dagger$ on siis matriisin kompleksikonjugaatin transpoosi.

Hermiten konjugaatin determinantti on

$\det(A^\dagger) = [\det(A)]^*.$

# hermiittinen

Olkoon $A_{n \times n}$ kompleksinen neliömatriisi. Tällöin on

$\begin{align*} \text{\textbf{hermiittinen}, jos } A^\dagger &=A, \\ \text{\textbf{antihermiittinen}, jos } A^\dagger &=-A, \\ \text{ja \textbf{unitaarinen}, jos } A^\dagger &=A^{-1}. \end{align*}$

Unitaariselle matriisille pätee

$AA^\dagger = I = A^\dagger A.$

Neliömatriisin ominaisarvoille pätee: $\newline$ 1. Hermiittisen matriisin ominaisarvot ovat reaaliset: $\lambda_i \in \mathbb{R}$ . $\newline$ 2. Antihermiittisen matriisin ominaisarvot ovat joko nollia tai täysin imaginaarisia: $\lambda_i = \pm bi$ . $\newline$ 3. Unitaarisen matriisin ominaisarvot ovat joko reaalisia tai kompleksisia, mutta aina ykkösen pituisia: $|\lambda_i|=1$ kaikilla .

Huomautus. Hermiittisen, antihermiittisen ja unitaarisen $n \times n$ -neliömatriisin ominaisvektoreista $\ve{x_i}$ , $i=1,\, 2,\, \dots, \, n$ voidaan muodostaa kompleksiavaruuden $\mathbb{C}^n$ ortonormitettu kanta, jolle sisätulo $\langle \ve{x_i},\, \ve{x_j}\rangle=1$ , kun i=j ja $\langle \ve{x_i}, \, \ve{x_j}\rangle=0$ , kun $i\neq j$ .

Esimerkki. Kompleksisen matriisin transpoosi, kompleksikonjugaatti, Hermiten konjugaatti ja käänteismatriisi.

Määritä matriisin $A = \begin{pmatrix} 0 &0 &-1\\ 0 &2 &2i\\ 3 &-i &0 \end{pmatrix}$ transpoosi, kompleksikonjugaatti, Hermiten konjugaatti ja käänteismatriisi.

Ratkaisu.
Transpoosissa rivit ja sarakkeet vaihtavat paikkaan, jolloin $A^T = \begin{pmatrix} 0 &0 &3\\ 0 &2 &-i\\ -1 &2i &0 \end{pmatrix}.$

Kompleksikonjugaatti: vaihdetaan imaginaariosan etumerkki, jolloin $A^* = \begin{pmatrix} 0 &0 &-1\\ 0 &2 &-2i\\ 3 &i &0 \end{pmatrix}.$

Hermiten konjugaatti on transpoosin kompleksikonjugaatti eli $A^{\dagger}=(A^T)^* = \begin{pmatrix} 0 &0 &3\\ 0 &2 &i\\ -1 &-2i &0 \end{pmatrix}.$

Käänteismatriisi lasketaan Gaussin ja Jordanin menetelmällä käyttäen rivioperaatioita $\begin{align*} &\begin{pmatrix}[ccc|ccc] 0 &0 &-1 &1 &0 &0\\ 0 &2 &2i &0 &1 &0\\ 3 &-i &0 &0 &0 &1 \end{pmatrix}\\ &\xrightarrow[R_1 \leftrightarrow R_3]{(-1)\cdot R_1} \begin{pmatrix}[ccc|ccc] 3 &-i &0 &0 &0 &1\\ 0 &2 &2i &0 &1 &0\\ 0 &0 &1 &-1 &0 &0 \end{pmatrix}\\ &\xrightarrow[\frac{1}{2}R_2]{\frac{1}{3}R_1} \begin{pmatrix}[ccc|ccc] 1 &-\frac{1}{3}i &0 &0 &0 &\frac{1}{3}\\ 0 &1 &i &0 &\frac{1}{2} &0\\ 0 &0 &1 &-1 &0 &0 \end{pmatrix}\\ &\xrightarrow[]{R_2 -i\cdot R_3} \begin{pmatrix}[ccc|ccc] 1 &-\frac{1}{3}i &0 &0 &0 &\frac{1}{3}\\ 0 &1 &0 &i &\frac{1}{2} &0\\ 0 &0 &1 &-1 &0 &0 \end{pmatrix}\\ &\xrightarrow[]{R_1+\frac{1}{3} i R_2} \begin{pmatrix}[ccc|ccc] 1 &0 &0 &-\frac{1}{3} &\frac{1}{6}i &\frac{1}{3}\\ 0 &1 &0 &i &\frac{1}{2} &0\\ 0 &0 &1 &-1 &0 &0 \end{pmatrix} \end{align*}$

Saatu käänteismatriisi on siis

$A^{-1}= \begin{pmatrix} -\frac{1}{3} &\frac{1}{6}i &\frac{1}{3}\\ i &\frac{1}{2} &0\\ -1 &0 &0 \end{pmatrix} = \frac{1}{6} \begin{pmatrix} -2 &i &2\\ 6i &3 &0\\ -6 &0 &0 \end{pmatrix}.$

Diracin spin-matriisi

Esimerkki. Diracin spin-matriisi.

Yksi Diracin spin-matriiseista on $\begin{align*} A=\begin{pmatrix} 0 &-i &0 &0\\ i &0 &0 &0\\ 0 &0 &0 &-i\\ 0 &0 &i &0 \end{pmatrix}. \end{align*}$

Määritä sen ominaisarvot ja ominaisvektorit, jälki, determinantti ja käänteismatriisi. Onko matriisi hermiittinen, antihermiittinen tai unitaarinen?

Ratkaisu. Matriisin lohkominen.

Jaetaan tehtävän helpottamiseksi matriisi lohkoihin: $\begin{align*} A= \begin{pmatrix} \red 0 &\red{-i} &0 &0\\ \red i &\red 0 &0 &0\\ 0 &0 &\blue 0 &\blue{-i}\\ 0 &0 &\blue i &\blue 0 \end{pmatrix} = \begin{pmatrix} \red {\sigma_2} &\mathbf{0}\\ \mathbf{0} &\blue {\sigma_2} \end{pmatrix}. \end{align*}$

Diracin spin-matriisi on siis lohkodiagonaalinen. Lohko $\sigma_2$ on $\sigma_2= \begin{pmatrix} 0 &-i\\ i &0 \end{pmatrix}.$ Tämä on eräs Paulin matriiseista, joilla on vakiintuneet $\sigma\text-$ merkinnät 1,2,3 tai x,y,z. Lisäksi lohko $\mathbf0$ on $\mathbf{0} =\begin{pmatrix} 0&0\\0&0\end{pmatrix}.$

Ratkaisu. Ominaisarvot.

Hyödynnetään matriisin lohkomuotoa.

Lohkomatriisin ominaisarvot ovat lohkojen ominaisarvot. Ratkaistaan siis matriisin lohkon $\sigma_2$ ominaisarvot karakteristisen yhtälön $\det(\lambda I-\sigma_2)=0$ avulla. Matriisin

$\begin{align*} \lambda I - \sigma_2 &= \begin{pmatrix} \lambda &0\\ 0 &\lambda \end{pmatrix} -\begin{pmatrix} 0 &-i\\ i &0 \end{pmatrix} \\&=\begin{pmatrix} \lambda &i\\ -i &\lambda \end{pmatrix} \end{align*}$

determinantti on

$\begin{vmatrix} \lambda &i\\ -i &\lambda \end{vmatrix}= \lambda^2 + i^2 = \lambda^2 -1.$

Karakteristinen yhtälö on siis $\lambda^2-1=0$ , jolloin kysytyt ominaisarvot ovat $\lambda_1 = 1$ ja $\lambda_2 =-1$ .

Ratkaisu. Ominaisvektorit.

Ominaisarvoyhtälö on $A \ve x = \lambda \ve x.$ Sijoittamalla matriisi ominaisarvo(t) $\lambda = \pm 1$ ja merkitsemällä $\ve x = (a,\,b,\,c,\,d)$ saadaan $\begin{pmatrix} 0 &-i &0&0\\ i &0 &0&0\\ 0&0 &0&-i\\ 0&0&i&0 \end{pmatrix} \begin{pmatrix} a\\ b\\ c\\ d \end{pmatrix} = \begin{pmatrix} -i\,b \\ i\,a\\ -i\,d\\ i\,c\\ \end{pmatrix}= \pm1\begin{pmatrix} a\\ b\\ c\\ d \end{pmatrix},$ missä plusmerkki vastaa ominaisarvoa $\lambda_1=1$ ja miinusmerkki ominaisarvoa $\lambda_2=-1.$ Saadaan $\lambda_{1}=1: \begin{cases} a = -ib\\ c = -id \end{cases}$ ja $\lambda_2 = -1: \begin{cases} a = ib\\ c = id \end{cases}.$

Voidaan valita $\begin{cases} a=1 \quad \text{tai}\quad a=i\\ c=0 \end{cases},$ jolloin $\begin{cases} b=i \quad \text{tai} \quad b=1\\ d=0 \end{cases}$ eli $\ve x_1 =(1,\, i, \, 0, \, 0)$ ja $\ve x_2 =(i,\, 1,\, 0,\, 0)$ ovat kaksi lineaarisesti riippumatonta vektoria. Toisaalta voidaan valita $\begin{cases} a=0 \\ c=1 \quad \text{tai}\quad c=i \end{cases},$ ja $\begin{cases} b=0\\ d=i \quad \text{tai} \quad d=1 \end{cases}$ eli $\ve x_3 = (0,\, 0,\, 1,\, i)$ ja $\ve x_4 = (0,\, 0,\, i,\, 1)$ ovat kaksi lineaarisesti riippumatonta vektoria.

Näin saadaan kaikki neljä lineaarisesti riippumatonta vektoria, joista $\ve x_1$ ja $\ve x_3$ vastaavat ominaisarvoa $\lambda_1$ ja $\ve x_2$ ja $\ve x_4$ arvoa $\lambda_2.$

Ratkaisu. Jälki ja determinantti.

Jälki

Lohkomatriisin jälki on diagonaalilohkojen jälkien summa eli $\operatorname{Tr}(A)=\operatorname{Tr}\begin{pmatrix} \sigma_2 & 0 \\ 0 & \sigma_2\end{pmatrix} =2\operatorname{Tr}(\sigma_2).$ Matriisin lohkon $\sigma_2$ jälki on $\operatorname{Tr}(\sigma_2)=\operatorname{Tr}\begin{pmatrix} 0 & -i \\ i & 0\end{pmatrix} =0,$ joten Diracin matriisin jälki on $\operatorname{Tr}(A) =0.$ Tämän voi todeta myös suoraan matriisista summaamalla diagonaalialkiot.

Determinantti

Hyödynnetään matriisin lohkomuotoa.

Lohkodiagonaalisen matriisin determinantti on diagonaalilohkojen determinanttien tulo eli

$\det (A) =\det\begin{pmatrix} \sigma_2 & 0 \\ 0 & \sigma_2\end{pmatrix}= \det (\sigma_2) \det (\sigma_2).$ Matriisin lohkon $\sigma_2$ determinantti on $\det(\sigma_2)=\begin{vmatrix} 0 & -i \\ i & 0\end{vmatrix} =0\cdot0-(-i)\cdot i =i^2 = -1,$ joten Diracin matriisin determinantti on $\det (A) = (-1)\cdot (-1)= 1$ .

Ratkaisu. Käänteismatriisi, hermiittisyys ja unitaarisuus.

Hyödynnetään jälleen matriisin lohkoja.

Käänteismatriisi

Käänteismatriisi saadaan sijoittamalla lohkojen tilalle niiden käänteismatriisit

$A^{-1}= \begin{pmatrix} \sigma_2^{-1} &0 \\ 0 &\sigma_2^{-1} \end{pmatrix}.$

Koska lohkot ovat samat, on niiden käänteismatriisikin sama. Merkitään lohkojen käänteismatriisia $\sigma_2^{-1}= \begin{pmatrix} \red a &\blue b\\ \green c &d \end{pmatrix},$ jolloin käänteismatriisin määritelmän mukaan saadaan matriisien kertolasku $\sigma_2\sigma_2^{-1}= \begin{pmatrix} 0 &-i\\ i &0 \end{pmatrix} \begin{pmatrix} \red a &\blue b\\ \green c &d \end{pmatrix} = \begin{pmatrix} 1 &0\\ 0 &1 \end{pmatrix}.$ Laskemalla tämä saadaan $\begin{pmatrix} -\green c i &-d i\\ \red a i &\blue b i \end{pmatrix} = \begin{pmatrix} 1 &0\\ 0 &1 \end{pmatrix},$ eli $\red{a=0},\quad d=0,\quad \blue{b=-i} \quad\text{ja}\quad \green{c=i}.$

Saatu käänteismatriisi lohkolle $\sigma_2$ on siis

$\sigma_2^{-1} = \begin{pmatrix} 0 &-i\\ i &0 \end{pmatrix} = \sigma_2,$ jolloin siis $A = A^{-1}$ .

A on hermiittinen, sillä

$\begin{align*} \sigma_2^\dagger &= \left({\begin{pmatrix} 0 &-i\\ i &0 \end{pmatrix}^*}\right)^T = {\begin{pmatrix} 0 &i\\ -i &0 \end{pmatrix}^T} \\&= \begin{pmatrix} 0 &-i\\ i &0 \end{pmatrix} = \sigma_2, \end{align*}$ jolloin siis $A^\dagger = A$ .

A on unitaarinen, sillä $A^{-1}=A^{\dagger}$ .

# ksisatulo

Kompleksinen sisätulo

Kun vektoreiden komponentteina on kompleksilukuja, täytyy määritellä kompleksivektoreiden sisätulo. Tämä on eräs yleistys tutusta reaalisten vektorien pistetulosta.

Olkoot esimerkiksi kaksi vektoria $\red{\ve a} = (\red{2 +i}, \, \red{-1}) \quad \text{ja} \quad \blue{\ve b} =(\blue{-i}, \,\blue 0).$ Näiden kompleksinen sisätulo on $\begin{align*} \langle \red{\ve a}, \blue{\ve b}\rangle &= {\red a}^*_1\blue b_1 +{\red a}^*_2\blue b_2\\ &=(\red{2 -i}) (\blue{-i}) + (\red{-1})(\blue 0) = -1-2i. \end{align*}$

Yleisesti olkoot kaksi avaruuden $\mathbb C^n$ kompleksivektoria $\red{\ve {a}}=(\red a_1,\,\red a_2,\,\dots,\,\red a_n),$ missä $\red a_j=x_{\red a_j}+{y}_{\red a_j}i,$ ja $\blue {\ve{b}}=(\blue b_1,\,\blue b_2,\,\dots,\,\blue b_n).$ missä $\blue b_j=x_{\blue b_j}+{y}_{\blue b_j}i.$ Kompleksinen sisätulo on $\begin{align*} \langle\red{\ve {a}}, \blue{\ve {b}}\rangle =&\ \sum_{j=1}^n {\red a}^*_j\blue b_j \\ =&\ (x_{\red a_1}-y_{\red a_1}i)(x_{\blue b_1}+y_{\blue b_1}i)\\&+\cdots+(x_{\red a_n}-y_{\red a_n}i)(x_{\blue b_n}+y_{\blue b_n}i), \end{align*}$ missä ${\red a}^*_j = x_{\red a_j} - y_{\red a_j}i$ on kompleksikonjugaatti.

Kompleksisten vektorien ja sisätulo voidaan kirjoittaa myös matriisitulona:

$\begin{align*} \langle\ve{a},\, \ve{b}\rangle &= \ve{a}^\dagger \ve{b} = \begin{pmatrix} a^*_1 &a_2^* &\cdots &a_n^* \end{pmatrix} \begin{pmatrix} b_1\\ b_2 \\ \vdots\\ b_n \end{pmatrix} \\&= a_1^*b_1+a_2^*b_2+ \cdots + a_n^*b_n. \end{align*}$ Vektorin $\ve{a}$ pituus (eli normi) on

$\begin{align*} | \ve{a} | &= \sqrt{\langle \ve{a},\, \ve{a}\rangle} \\&= \sqrt{|a_1|^2+|a_2|^2+\cdots+ |a_n|^2} \geq 0. \end{align*}$

Näille sivuille inspiraatiota on haettu pääasiassa alla olevista lähteistä:

Petri Juutinen: Lineaarinen algebra ja geometria 1. Luentomoniste, 2019.
Petri Juutinen: Lineaarinen algebra ja geometria 2. Luentomoniste, 2020.
Emma Leppälä: Matriisilaskenta. Luentomoniste, 2019.
Juha Merikoski: Lineaarialgebra. Luentodiat, 2016.