Matriisit työkaluina
Lineaarinen yhtälöryhmä 
Lineaarisessa yhtälöryhmässä ratkaistavat muuttujat esiintyvät lineaarisina termeinä, eli kerrottuna jollain vakiolla. Esimerkkejä epälineaarisista termeistä ovat
,
ja
Lineaarinen yhtälöryhmä on esimerkiksi jossa ratkaistavia muuttujia on kolme:
ja
Yleisesti muuttujan
ja
yhtälönYhtälöryhmä voidaan ratkaista, jos
lineaarinen yhtälöryhmä on
missä
ja
ovat vakioita. Tämä voidaan kirjoittaa matriisiyhtälönä
tai lyhyesti
missä
on
-kerroinmatriisi ja
on vakiovektori.
Ratkaistavana on siis vektori jonka komponentteina on yhtälöryhmän muuttujat.
Olkoon kääntyvä
-matriisi. Yhtälöllä
on tällöin yksikäsitteinen ratkaisu
kaikilla vakiovektoreilla
.
Neliömatriisille seuraavat ehdot ovat yhtäpitäviä:
1. Matriisin sarakkeet ja rivit ovat lineaarisesti riippumattomat.
2.
3.
on kääntyvä.
4. Yhtälöllä
on (yksikäsitteinen) ratkaisu jokaiselle
5. Yhtälöllä
on vain triviaaliratkaisu
.
Yhtälöryhmän kerroinmatriisi on
,
, joten se on kääntyvä ja
Näin ollen yhtälöryhmän ainoa ratkaisu
on
eli
ja
.
Tärkeitä käsitteitä
Vektoriavaruus ja aliavaruus
Vektoriavaruutta voisi kuvata 12 tunnin kello. Minkä tahansa kahden kellonajan summa pysyy aina kellonaikojen 1-12 välillä. Esimerkkikellossamme on laskettu kellonajat 9+4 ja saatu 1. Vaikka laskennallisesti tulos menisikin avaruuden ulkopuolelle (9+4=13), se kuitenkin pyörähtää takaisin "kelloavaruuteen". Samoin, jos lisätään 9 tuntia 6 kertaa kellonaikaan 12, saamme 12+54=66. Kellossamme aika tällöin on kuitenkin 6. Kahdentoista tunnin kello toimii aliavaruutena 24 tunnin kellolle! (Tämä esimerkki on tehty äärelliseen tapaukseenAlkioiden määrä on pienempi kuin .. Yleensä vektoriavaruuksia käsitellään äärettöminä.)
Vektoriavaruus on joukko vektoreita, joille on määritelty laskusääntöjä. Esimerkiksi kahden avaruuteen kuuluvan vektorin summa on kolmas vektori, joka myös kuuluu avaruuteen.
Reaalinen vektoriavaruus on epätyhjä joukko , jossa on määritelty kaksi laskutoimitusta, yhteenlasku ja reaaliluvulla kertominen, niin, että seuraavat aksioomat ovat totta kaikille vektoreille
ja kaikille reaaliluvuille
:
(Suljettu yhteenlaskun suhteen)
- on olemassa nollavektori
, jolle pätee
kaikilla
- jokaiselle
on olemassa vastavektori
siten, että
(Suljettu skalaarilla kertomisen suhteen)
Huomautuksia. Ominaisuudet 1-5 tarkoittavat, että on Abelin ryhmä yhteenlaskun suhteen. "Suljettu laskutoimituksen suhteen" tarkoittaa sitä, että kahden vektorin summan tulee pysyä vektoriavaruudessa ja reaaliluvulla kerrottu vektori pysyy myös vektoriavaruudessa.
Vektoriavaruus :ssa on koko avaruus, jonka
-,
- ja
-akselit virittävät.
Vektoriavaruuden osajoukko
on
:n aliavaruus seuraavien ehtojen toteutuessa:
- jos
, niin myös
kaikilla
- jos
, niin myös
.
On hyvä huomata, että on myös itse vektoriavaruus, sillä se toteuttaa kaikki vektoriavaruuden aksioomat.
Avaruuden aliavaruus on esimerkiksi origon kautta kulkeva
:n
-taso. Voisiko jokin muukin olla
:n aliavaruus? Entä
:n aliavaruus? Vastaus.Ainakin reaaliakselit
ja
.
Lineaarinen riippumattomuus ja matriisit
Avaruuden vektorit
ovat lineaarisesti riippumattomattomat eli LI (linearly independent) jos ja vain jos ehto
toteutuu ainoastaan, kun
. Toisin sanoen mitään vektoreista ei voida muodostaa summaamalla muita vakiolla kerrottuja vektoreita.
Muussa tapauksessa vektorit ovat lineaarisesti riippuvat eli LD (linearly dependent). Lineaarinen riippuvuus tarkoittaa, että vektorit voidaan esittää toistensa lineaarikombinaationa.
Seuraavat ehdot ovat yhtäpitäviä (eli yhdestä seuraa loput) neliömatriiseille :
1. Matriisin
sarakkeet ja rivit ovat lineaarisesti riippumattomat.
2.
3.
on kääntyvä.
4. Yhtälöllä
on (yksikäsitteinen) ratkaisu jokaiselle
5. Yhtälöllä
on vain triviaaliratkaisu
.
Ovatko vektorit ja
lineaarisesti riippumattomat?
Ratkaisu. Kirjoitetaan vektorit matriisimuotoon ja lasketaan sen determinantti
. Koska
niin vektorit
ja
ovat lineaarisesti riippumattomat.
Vektorit eivät osu samalle suoralle, jolloin niiden avulla muodostuu suunnikkaan pinta-ala , mikä tarkoittaa, että vektorit ovat lineaarisesti riippumattomia.
Ovatko vektorit ja
lineaarisesti riippumattomat?
Ratkaisu. Vektori voidaan esittää vektorin
lineaarikombinaationa eli
. Näin ollen vektorit
ja
ovat lineaarisesti riippuvat.
Lineaarinen riippuvuus voidaan todeta myös determinantin avulla,
Vektorit osuvat samalle suoralle, jolloin ne ovat lineaarisesti riippuvia eli toinen on toisen lineaarikombinaatio. (Pinta-alallista suunnikasta ei muodostu, .)
Lineaarikuvaus ja matriisit
Olkoot ja
vektoriavaruuksia. Funktio
on lineaarikuvaus, jos
Jokaiselle lineaarikuvaukselle on olemassa yksikäsitteinen matriisi
siten, että kuvaus vastaa matriisilla kertomista, eli
.
Mikä tällainen matriisi sitten on? Matriisin sarakevektorit ovat kuvauksen määrittelyjoukon standardikannan kuvavektorit. Esimerkiksi kuvausta
vastaa
-matriisi
.
Matriisin koko voidaan perustella siten, että rivejä on kappaletta, koska kuvavektoreilla on
komponenttia. Sarakkeita on
kappaletta, koska määrittelyjoukossa on
kantavektoria.
Yleisesti kuvausta vastaava matriisi on
.
Olkoon lineaarikuvaus, jolle
Merkitään
Nyt kaikille
. Esimerkiksi
Alla olevissa kuvissa on esitetty vektorit ,
ja
:ssa ja miten ne kuvautuvat vektoreiksi
,
ja
:ssa.
Voit pyörittää ja zoomata yllä olevaa kuvaa, jotta hahmotat paremmin vektoreiden sijainnit.
Ortogonaalisuus, ortonormaalius ja kanta
Joukko avaruuden
vektoreita on
- ortogonaalinen, jos
aina kun
.
(Kohtisuoruus)
- ortonormaali, jos se on ortogonaalinen ja lisäksi
kaikilla
. (Vektorin pituus = 1)
Kuvan vektorit ovat ortogonaalisia, mutta eivät ortonormaaleja.
Olkoon aliavaruus. Vektorit
muodostavat aliavaruuden
kannan, jos
on vektorien lineaarinen verho:
. Toisin sanoen jokainen
vektori voidaan kirjoittaa vektorien
lineaarikombinaationa.
ovat lineaarisesti riippumattomat.
Tutuin kanta on ns. standardikanta, esimerkiksi :n standardikanta on
Standardikanta on ortogonaalinen eli kantavektorit ovat kohtisuorassa toisiaan vasten ja ortonormaali eli ortogonaalisuuden lisäksi kantavektoreiden pituus on 1. Kantavektoreiden avulla viritetään koko avaruus .
Gramin ja Schmidtin ortonormalisointi
Olkoon aliavaruuden
jokin kanta. Määritellään vektorit
seuraavasti:
Tällöin
on aliavaruuden
ortogonaalinen kanta ja
sen ortonormaali kanta.
Huomautus. Yllä oleva lauseke on vektorin
projektio vektorin
suhteen.
Gramin ja Schmidtin ortonormalisointimenetelmällä saadaan mistä tahansa kannasta muodostettua ortonormaali kanta.
Tarkastellaan kolmiulotteisesssa avaruudessa kolmea vektoria, jotka muodostavat tämän avaruuden kannan, mutta jotka eivät ole kohtisuorassa toisiaan vasten. Tämä kanta ei siis ole ortogonaalinen. Ortogonaalinen kanta saadaan seuraavasti:
Otetaan ensimmäinen ei-ortogonaalisen kannan vektori ja määritetään se uuden ortogonaalisen kannan ensimmäiseksi kantavektoriksi.
Vähennetään ei-ortogonaalisen kannan toisesta kantavektorista sen projektio ortogonaalisen kannan ensimmäiselle kantavektorille, jolloin jäljelle jää vain ensimmäistä kantavektoria vastaan kohtisuora osa. Näin saadusta vektorista tulee ortogonaalisen kannan toinen kantavektori.
Toistetaan edellinen vaihe ei-ortogonaalisen kannan kolmannelle kantavektorille ja lisäksi vähennetään siitä sen projektio ortogonaalisen kannan toiselle kantavektorille, jolloin jäljelle jää myös toista kantavektoria vastaan kohtisuora osa. Näin saadusta vektorista tulee ortogonaalisen kannan kolmas kantavektori.
Nämä vektorit muodostavat siis ortogonaalisen kannan ja siitä saadaan ortonormaali jakamalla vektorit niiden pituuksillaan.
Olkoon lineaarisesti riippumattomat vektorit ,
ja
. Koska vektorit
ovat lineaarisesti riippumattomia, niin ne virittävät kolmiulotteisen avaruuden
ja ne muodostavat sen kannan. Tämä kanta ei kuitenkaan ole ortogonaalinen.
Muodostetaan Gramin ja Schmidtin ortonormalisointi-menetelmällä tästä kannasta ortonormaali kanta avaruudelle .
Valitaan Saatu kanta
on ortogonaalinen. Ortonormaali kanta saadaan, kun jaetaan vektorit niiden pituudella, toisin sanoen tehdään niistä ykkösen pituisia:
Vasemmalla puolella on kuvattu tilanne jossa vektorit muodostavat avaruuden
kannan. Kuvasta nähdään, että vektorit eivät ole ortogonaalisia tai yksikkövektoreita.
GS-menetelmällä saatu ortonormaali kanta on esitetty oikealla puolella. Vektorit ,
ja
ovat nyt kohtisuorassa toisiaan vastaan ja ne on normitettu (lihavoidut nuolet).
Ominaisarvot ja -vektorit
Reaaliluku on neliömatriisin
ominaisarvo, jos on olemassa ominaisvektori
siten, että
Nollavektori ei ole ominaisvektori, vaikka sille pätee
.
Myös vakiolla kerrottu ominaisvektori
on ominaisvektori, sillä
Yhtälö voidaan kirjoittaa yhtäpitävästi muodossa
tai
missä
on yksikkömatriisi.
Vektori on matriisin
ominaisarvoa 2 vastaava ominaisvektori, sillä
Puolestaan vektori ei ole matriisin
ominaisvektori, sillä
Ei siis ole olemassa lukua
, jolla yhtälö
toteutuu.
Yllä olevasta kuvasta nähdään, että kun matriisilla operoidaan vektoria
, joka on sen ominaisvektori, niin saadaan uusi vektori, joka on samansuuntainen vektorin
kanssa, mutta kaksi kertaa pidempi
. Matriisi on siis skaalannut tätä vektoria ominaisarvon verran.
Jos puolestaan matriisilla operoidaan vektoria
, joka ei ole sen ominaisvektori, niin saatu tulovektori ei ole samansuuntainen vektorin
kanssa. Matriisi on siis kiertänyt tätä vektoria.
Tämä on ominaisarvojen ja vektoreiden geometrinen tulkinta.
Matriisin ominaisvektorit ovat siis ne vektorit, jotka vain skaalautuvat eli säilyttävät suuntansa, kun niitä operoidaan matriisilla
. Ominaisarvot puolestaan kertovat kuinka paljon ominaisvektoreita on skaalattu.
Karakteristinen yhtälö ja polynomi
Ominaisarvot voidaan ratkaista karakteristisen polynomin avulla. Reaaliluku
on matriisin
ominaisarvo jos ja vain jos
Ominaisarvo-ongelma on yleisesti missä
on neliömatriisi,
on vektori ja
on vakio. Matriisissa on yhtä monta riviä (ja samalla saraketta) kuin vektorissa on komponentteja.
Etsitään yhtälöä muokkaamalla ongelman karakteristinen yhtälö. Jokaiselle matriisille (ja siten myös vektorille ) löytyy sopivan kokoinen yksikkömatriisi
, jolle
Sijoittamalla tämä ominaisarvo-ongelmaan saadaan
Nyt vähentämällä puolittain yhtälön vasen puoli saadaan
Tähän voidaan käyttää tietoa matriisin kääntyvyyden ja determinantin yhteydestä. Jos matriisi
olisi kääntyvä, voisimme kertoa yhtälön puolittain käänteismatriisilla, ja saataisiin
Ominaisarvo-ongelmalle halutaan kuitenkin ratkaisuja, joille joten matriisi
ei saa olla kääntyvä. Tiedetään, että tämä on totta jos ja vain jos
Tämä on ongelman karakteristinen yhtälö.
Joskus tämä kirjoitetaan muodossa
Yllä olevaa yhtälöä kutsutaan karakteristiseksi yhtälöksi ja se on astetta oleva polynomiyhtälö, jolla on aina
ratkaisua (myös kompleksiset ratkaisut ja ratkaisujen kertaluvut huomioiden) eli se voidaan kirjoittaa muodossa
missä
ovat matriisin
ominaisarvot.
Lasketaan karakteristisen yhtälön avulla matriisin
ominaisarvot.
Lasketaan matriisi :
jolloin .
Nyt karakteristinen yhtälö antaa
Matriisin ominaisarvot ovat siis 2 ja 5.
Muista, että karakteristisella polynomilla on kertaluvut ja kompleksiset ratkaisut huomioon ottaen aina täsmälleen ratkaisua. Tässä karakteristinen yhtälö on toisen asteen polynomi, joten sillä on täsmälleen 2 ratkaisua.
Aiemmin saatiin selville, että matriisin ominaisarvot ovat 2 ja 5. Etsitään seuraavaksi niitä vastaavat ominaisvektorit.
Selvitetään kummallekin ominaisarvolle ja
, mitkä vektorit toteuttavat yhtälön
. Aiemmin laskettiin matriisille
.
Tarkastellaan ensin tapaus :
Yhtälön toteuttaa siis kaikki muotoa
olevat vektorit ja esimerkiksi tuo aikaisemmassa esimerkissä oleva vektori
.
Tarkastellaan sitten tapaus :
Yhtälön toteuttaa siis kaikki muotoa
olevat vektorit ja esimerkiksi vektori
.
Neliömatriisin diagonalisointi
Neliömatriisi on diagonalisoituva, jos on olemassa kääntyvä
-neliömatriisi
siten, että
missä
. Tällöin
ovat matriisin
ominaisarvot ja matriisin
sarakkeina ovat matriisin
ominaisvektorit.
Huomautus. Tämä voidaan myös esittää muodossa
Aiemmin saatiin selville, että matriisin ominaisarvot ovat
ja
. Lisäksi niille löydettiin vastaavat ominaisvektorit
ja
.
Matriisi on siis muotoa
Nyt suora lasku antaa
joka on diagonaalimatriisi .
Matriisien lohkomuodot
Matriisi voidaan esittää lohkomuodossa
missä lohko
on kokoa
ja
ja
Älä sekoita matriisin lohkoa alimatriisiin, jolla on sama merkintä
Matriisi voidaan jakaa lohkoihin
missä
,
,
ja
.
Vaikka tässä esimerkissä kaikki lohkot ovat -matriiseja, niin matriiseja voidaan lohkottaa myös eri kokoisiksi lohkoiksi tilanteeseen sopivalla tavalla.
Edellisen matriisin voi jakaa myös vaikkapa - ja
-matriiseiksi:
Lohkomatriisien kertolasku
Lohkomatriiseille pätee samat laskusäännöt kuin normaaleille matriiseillekin. Laskutoimitukset voidaan suorittaa lohkoittain. Olkoon ja
Nyt matriisien tulon lohko
on
mikäli lohkojen koot ovat yhteensopivia eli kertolasku voidaan suorittaa.
Olkoon matriisit ja
:
Nyt matriisien ja
tulo
voidaan esittää muodossa:
Lasketaan tulot:
Lopuksi lasketaan lohkot yhteen:
ja
Yhdistetään ja saadaan tulo
Lohkodiagonaalinen matriisi
Neliömatriisi on lohkodiagonaalinen, jos sillä on esitys
missä kukin on neliömatriisi ja
. Tällöin voidaan merkitä
.
Huomaa, että lohkomatriisit eivät välttämättä ole diagonaalimatriiseja.
Lohkodiagonaaliselle matriisille pätee:
1. Potenssit saadaan lohkojen potensseista:
2.
on kääntyvä jos ja vain jos jokainen diagonaalilohko
on kääntyvä. Tällöin
3. Determinantti on lohkojen determinanttien tulo:
Neliömatriisi on lohkodiagonaalinen seuraavalla lohkojaolla:
missä ,
ja
.
Lasketaan lohkojen determinantit. Ensimmäisen lohkon determinantti on helpointa laskea ensimmäisen sarakkeen suhteen, sillä siinä on kaksi nollaa.
Matriisin determinantti on siis
Etsi matriisin käänteismatriisi, kun
Ratkaisu. Jaetaan matriisi sopiviin lohkoihin:
Saadaan diagonaalimatriisi, joka on kääntyvä sillä
ja
Lasketaan diagonaalilohkojen käänteismatriisit:
ja
Siis matriisin käänteismatriisi
on
Kompleksialkioisia matriiseja
Kompleksialkioisen matriisin alkiot ovat kompleksilukuja
Kompleksiarvoisilla matriiseilla operoidaan aivan samoin kuin reaaliarvoisilla. Kompleksiarvoinen matriisi voidaan hajottaa kahdeksi reaaliseksi matriisiksi ottamalla alkioiden reaaliosat
ja imaginaariosat
erilleen:
missä
ja
ovat reaalialkioisia matriiseja.
Matriisin kompleksikonjugaatti voidaan tällöin kirjoittaa
Lasketaan kahden kompleksisen matriisin ja
tulo
Kompleksialkioisen neliömatriisin Hermiten konjugaatti on
Hermiten konjugaatti
on siis matriisin kompleksikonjugaatin transpoosi.
Hermiten konjugaatin determinantti on
Olkoon kompleksinen neliömatriisi. Tällöin
on
Unitaariselle matriisille pätee
Neliömatriisin ominaisarvoille pätee: 1. Hermiittisen matriisin ominaisarvot ovat reaaliset:
.
2. Antihermiittisen matriisin ominaisarvot ovat joko nollia tai täysin imaginaarisia:
.
3. Unitaarisen matriisin ominaisarvot ovat joko reaalisia tai kompleksisia, mutta aina ykkösen pituisia:
kaikilla
.
Huomautus. Hermiittisen, antihermiittisen ja unitaarisen -neliömatriisin ominaisvektoreista
,
voidaan muodostaa kompleksiavaruuden
ortonormitettu kanta, jolle sisätulo
, kun
ja
, kun
.
Määritä matriisin transpoosi, kompleksikonjugaatti, Hermiten konjugaatti ja käänteismatriisi.
Ratkaisu.
Transpoosissa rivit ja sarakkeet vaihtavat paikkaan, jolloin
Kompleksikonjugaatti: vaihdetaan imaginaariosan etumerkki, jolloin
Hermiten konjugaatti on transpoosin kompleksikonjugaatti eli
Käänteismatriisi lasketaan Gaussin ja Jordanin menetelmällä käyttäen rivioperaatioita
Saatu käänteismatriisi on siis
Diracin spin-matriisi
Yksi Diracin spin-matriiseista on
Määritä sen ominaisarvot ja ominaisvektorit, jälki, determinantti ja käänteismatriisi. Onko matriisi hermiittinen, antihermiittinen tai unitaarinen?
Jaetaan tehtävän helpottamiseksi matriisi lohkoihin:
Diracin spin-matriisi on siis lohkodiagonaalinen. Lohko
on
Tämä on eräs Paulin matriiseista, joilla on vakiintuneet
merkinnät
tai
Lisäksi lohko
on
Hyödynnetään matriisin lohkomuotoa.
Lohkomatriisin ominaisarvot ovat lohkojen ominaisarvot. Ratkaistaan siis matriisin lohkon
ominaisarvot karakteristisen yhtälön
avulla. Matriisin
determinantti on
Karakteristinen yhtälö on siis , jolloin kysytyt ominaisarvot ovat
ja
.
Ominaisarvoyhtälö on Sijoittamalla matriisi
ominaisarvo(t)
ja merkitsemällä
saadaan
missä plusmerkki vastaa ominaisarvoa
ja miinusmerkki ominaisarvoa
Saadaan
ja
Voidaan valita jolloin
eli
ja
ovat kaksi lineaarisesti riippumatonta vektoria. Toisaalta voidaan valita
ja
eli
ja
ovat kaksi lineaarisesti riippumatonta vektoria.
Näin saadaan kaikki neljä lineaarisesti riippumatonta vektoria, joista ja
vastaavat ominaisarvoa
ja
ja
arvoa
Jälki
Lohkomatriisin jälki on diagonaalilohkojen jälkien summa eli Matriisin lohkon
jälki on
joten Diracin matriisin
jälki on
Tämän voi todeta myös suoraan matriisista
summaamalla diagonaalialkiot.
Determinantti
Hyödynnetään matriisin lohkomuotoa.
Lohkodiagonaalisen matriisin determinantti on diagonaalilohkojen determinanttien tulo eli
Matriisin lohkon
determinantti on
joten Diracin matriisin
determinantti on
.
Hyödynnetään jälleen matriisin lohkoja.
Käänteismatriisi
Käänteismatriisi saadaan sijoittamalla lohkojen tilalle niiden käänteismatriisit
Koska lohkot ovat samat, on niiden käänteismatriisikin sama. Merkitään lohkojen käänteismatriisia jolloin käänteismatriisin määritelmän mukaan saadaan matriisien kertolasku
Laskemalla tämä saadaan
eli
Saatu käänteismatriisi lohkolle on siis
jolloin siis
.
A on hermiittinen, sillä
jolloin siis
.
A on unitaarinen, sillä .
Kompleksinen sisätulo
Kun vektoreiden komponentteina on kompleksilukuja, täytyy määritellä kompleksivektoreiden sisätulo. Tämä on eräs yleistys tutusta reaalisten vektorien pistetulosta.
Olkoot esimerkiksi kaksi vektoria Näiden kompleksinen sisätulo on
Yleisesti olkoot kaksi avaruuden kompleksivektoria
missä
ja
missä
Kompleksinen sisätulo on
missä
on kompleksikonjugaatti.
Kompleksisten vektorien ja
sisätulo voidaan kirjoittaa myös matriisitulona:
Vektorin
pituus (eli normi) on
Näille sivuille inspiraatiota on haettu pääasiassa alla olevista lähteistä:
- Petri Juutinen: Lineaarinen algebra ja geometria 1. Luentomoniste, 2019.
- Petri Juutinen: Lineaarinen algebra ja geometria 2. Luentomoniste, 2020.
- Emma Leppälä: Matriisilaskenta. Luentomoniste, 2019.
- Juha Merikoski: Lineaarialgebra. Luentodiat, 2016.
These are the current permissions for this document; please modify if needed. You can always modify these permissions from the manage page.