Matriisit työkaluina
Lineaarinen yhtälöryhmä
Lineaarisessa yhtälöryhmässä ratkaistavat muuttujat esiintyvät lineaarisina termeinä, eli kerrottuna jollain vakiolla. Esimerkkejä epälineaarisista termeistä ovat , ja
Lineaarinen yhtälöryhmä on esimerkiksi jossa ratkaistavia muuttujia on kolme: ja
Yleisesti muuttujan ja yhtälönYhtälöryhmä voidaan ratkaista, jos lineaarinen yhtälöryhmä on missä ja ovat vakioita. Tämä voidaan kirjoittaa matriisiyhtälönä tai lyhyesti missä on -kerroinmatriisi ja on vakiovektori.
Ratkaistavana on siis vektori jonka komponentteina on yhtälöryhmän muuttujat.
Olkoon kääntyvä -matriisi. Yhtälöllä on tällöin yksikäsitteinen ratkaisu kaikilla vakiovektoreilla .
Neliömatriisille seuraavat ehdot ovat yhtäpitäviä:
1. Matriisin sarakkeet ja rivit ovat lineaarisesti riippumattomat. 2. 3. on kääntyvä. 4. Yhtälöllä on (yksikäsitteinen) ratkaisu jokaiselle 5. Yhtälöllä on vain triviaaliratkaisu .
Yhtälöryhmän kerroinmatriisi on , , joten se on kääntyvä ja
Näin ollen yhtälöryhmän ainoa ratkaisu on
eli ja .
Tärkeitä käsitteitä
Vektoriavaruus ja aliavaruus
Vektoriavaruutta voisi kuvata 12 tunnin kello. Minkä tahansa kahden kellonajan summa pysyy aina kellonaikojen 1-12 välillä. Esimerkkikellossamme on laskettu kellonajat 9+4 ja saatu 1. Vaikka laskennallisesti tulos menisikin avaruuden ulkopuolelle (9+4=13), se kuitenkin pyörähtää takaisin "kelloavaruuteen". Samoin, jos lisätään 9 tuntia 6 kertaa kellonaikaan 12, saamme 12+54=66. Kellossamme aika tällöin on kuitenkin 6. Kahdentoista tunnin kello toimii aliavaruutena 24 tunnin kellolle! (Tämä esimerkki on tehty äärelliseen tapaukseenAlkioiden määrä on pienempi kuin .. Yleensä vektoriavaruuksia käsitellään äärettöminä.)
Vektoriavaruus on joukko vektoreita, joille on määritelty laskusääntöjä. Esimerkiksi kahden avaruuteen kuuluvan vektorin summa on kolmas vektori, joka myös kuuluu avaruuteen.
Reaalinen vektoriavaruus on epätyhjä joukko , jossa on määritelty kaksi laskutoimitusta, yhteenlasku ja reaaliluvulla kertominen, niin, että seuraavat aksioomat ovat totta kaikille vektoreille ja kaikille reaaliluvuille :
- (Suljettu yhteenlaskun suhteen)
- on olemassa nollavektori , jolle pätee kaikilla
- jokaiselle on olemassa vastavektori siten, että
- (Suljettu skalaarilla kertomisen suhteen)
Huomautuksia. Ominaisuudet 1-5 tarkoittavat, että on Abelin ryhmä yhteenlaskun suhteen. "Suljettu laskutoimituksen suhteen" tarkoittaa sitä, että kahden vektorin summan tulee pysyä vektoriavaruudessa ja reaaliluvulla kerrottu vektori pysyy myös vektoriavaruudessa.
Vektoriavaruus :ssa on koko avaruus, jonka -, - ja -akselit virittävät.
Vektoriavaruuden osajoukko on :n aliavaruus seuraavien ehtojen toteutuessa:
- jos , niin myös kaikilla
- jos , niin myös .
On hyvä huomata, että on myös itse vektoriavaruus, sillä se toteuttaa kaikki vektoriavaruuden aksioomat.
Avaruuden aliavaruus on esimerkiksi origon kautta kulkeva :n -taso. Voisiko jokin muukin olla :n aliavaruus? Entä :n aliavaruus? Vastaus.Ainakin reaaliakselit ja .
Lineaarinen riippumattomuus ja matriisit
Avaruuden vektorit ovat lineaarisesti riippumattomattomat eli LI (linearly independent) jos ja vain jos ehto toteutuu ainoastaan, kun . Toisin sanoen mitään vektoreista ei voida muodostaa summaamalla muita vakiolla kerrottuja vektoreita.
Muussa tapauksessa vektorit ovat lineaarisesti riippuvat eli LD (linearly dependent). Lineaarinen riippuvuus tarkoittaa, että vektorit voidaan esittää toistensa lineaarikombinaationa.
Seuraavat ehdot ovat yhtäpitäviä (eli yhdestä seuraa loput) neliömatriiseille : 1. Matriisin sarakkeet ja rivit ovat lineaarisesti riippumattomat. 2. 3. on kääntyvä. 4. Yhtälöllä on (yksikäsitteinen) ratkaisu jokaiselle 5. Yhtälöllä on vain triviaaliratkaisu .
Ovatko vektorit ja lineaarisesti riippumattomat?
Ratkaisu. Kirjoitetaan vektorit matriisimuotoon ja lasketaan sen determinantti . Koska niin vektorit ja ovat lineaarisesti riippumattomat.
Vektorit eivät osu samalle suoralle, jolloin niiden avulla muodostuu suunnikkaan pinta-ala , mikä tarkoittaa, että vektorit ovat lineaarisesti riippumattomia.
Ovatko vektorit ja lineaarisesti riippumattomat?
Ratkaisu. Vektori voidaan esittää vektorin lineaarikombinaationa eli . Näin ollen vektorit ja ovat lineaarisesti riippuvat.
Lineaarinen riippuvuus voidaan todeta myös determinantin avulla,
Vektorit osuvat samalle suoralle, jolloin ne ovat lineaarisesti riippuvia eli toinen on toisen lineaarikombinaatio. (Pinta-alallista suunnikasta ei muodostu, .)
Lineaarikuvaus ja matriisit
Olkoot ja vektoriavaruuksia. Funktio on lineaarikuvaus, jos
Jokaiselle lineaarikuvaukselle on olemassa yksikäsitteinen matriisi siten, että kuvaus vastaa matriisilla kertomista, eli .
Mikä tällainen matriisi sitten on? Matriisin sarakevektorit ovat kuvauksen määrittelyjoukon standardikannan kuvavektorit. Esimerkiksi kuvausta vastaa -matriisi .
Matriisin koko voidaan perustella siten, että rivejä on kappaletta, koska kuvavektoreilla on komponenttia. Sarakkeita on kappaletta, koska määrittelyjoukossa on kantavektoria.
Yleisesti kuvausta vastaava matriisi on .
Olkoon lineaarikuvaus, jolle
Merkitään
Nyt kaikille . Esimerkiksi
Alla olevissa kuvissa on esitetty vektorit , ja :ssa ja miten ne kuvautuvat vektoreiksi , ja :ssa.
Voit pyörittää ja zoomata yllä olevaa kuvaa, jotta hahmotat paremmin vektoreiden sijainnit.
Ortogonaalisuus, ortonormaalius ja kanta
Joukko avaruuden vektoreita on
- ortogonaalinen, jos aina kun . (Kohtisuoruus)
- ortonormaali, jos se on ortogonaalinen ja lisäksi kaikilla . (Vektorin pituus = 1)
Kuvan vektorit ovat ortogonaalisia, mutta eivät ortonormaaleja.
Olkoon aliavaruus. Vektorit muodostavat aliavaruuden kannan, jos
on vektorien lineaarinen verho: . Toisin sanoen jokainen vektori voidaan kirjoittaa vektorien lineaarikombinaationa.
ovat lineaarisesti riippumattomat.
Tutuin kanta on ns. standardikanta, esimerkiksi :n standardikanta on
Standardikanta on ortogonaalinen eli kantavektorit ovat kohtisuorassa toisiaan vasten ja ortonormaali eli ortogonaalisuuden lisäksi kantavektoreiden pituus on 1. Kantavektoreiden avulla viritetään koko avaruus .
Gramin ja Schmidtin ortonormalisointi
Olkoon aliavaruuden jokin kanta. Määritellään vektorit seuraavasti: Tällöin on aliavaruuden ortogonaalinen kanta ja sen ortonormaali kanta.
Huomautus. Yllä oleva lauseke on vektorin projektio vektorin suhteen.
Gramin ja Schmidtin ortonormalisointimenetelmällä saadaan mistä tahansa kannasta muodostettua ortonormaali kanta.
Tarkastellaan kolmiulotteisesssa avaruudessa kolmea vektoria, jotka muodostavat tämän avaruuden kannan, mutta jotka eivät ole kohtisuorassa toisiaan vasten. Tämä kanta ei siis ole ortogonaalinen. Ortogonaalinen kanta saadaan seuraavasti:
Otetaan ensimmäinen ei-ortogonaalisen kannan vektori ja määritetään se uuden ortogonaalisen kannan ensimmäiseksi kantavektoriksi.
Vähennetään ei-ortogonaalisen kannan toisesta kantavektorista sen projektio ortogonaalisen kannan ensimmäiselle kantavektorille, jolloin jäljelle jää vain ensimmäistä kantavektoria vastaan kohtisuora osa. Näin saadusta vektorista tulee ortogonaalisen kannan toinen kantavektori.
Toistetaan edellinen vaihe ei-ortogonaalisen kannan kolmannelle kantavektorille ja lisäksi vähennetään siitä sen projektio ortogonaalisen kannan toiselle kantavektorille, jolloin jäljelle jää myös toista kantavektoria vastaan kohtisuora osa. Näin saadusta vektorista tulee ortogonaalisen kannan kolmas kantavektori.
Nämä vektorit muodostavat siis ortogonaalisen kannan ja siitä saadaan ortonormaali jakamalla vektorit niiden pituuksillaan.
Olkoon lineaarisesti riippumattomat vektorit , ja . Koska vektorit ovat lineaarisesti riippumattomia, niin ne virittävät kolmiulotteisen avaruuden ja ne muodostavat sen kannan. Tämä kanta ei kuitenkaan ole ortogonaalinen.
Muodostetaan Gramin ja Schmidtin ortonormalisointi-menetelmällä tästä kannasta ortonormaali kanta avaruudelle .
Valitaan Saatu kanta on ortogonaalinen. Ortonormaali kanta saadaan, kun jaetaan vektorit niiden pituudella, toisin sanoen tehdään niistä ykkösen pituisia:
Vasemmalla puolella on kuvattu tilanne jossa vektorit muodostavat avaruuden kannan. Kuvasta nähdään, että vektorit eivät ole ortogonaalisia tai yksikkövektoreita.
GS-menetelmällä saatu ortonormaali kanta on esitetty oikealla puolella. Vektorit , ja ovat nyt kohtisuorassa toisiaan vastaan ja ne on normitettu (lihavoidut nuolet).
Ominaisarvot ja -vektorit
Reaaliluku on neliömatriisin ominaisarvo, jos on olemassa ominaisvektori siten, että
Nollavektori ei ole ominaisvektori, vaikka sille pätee .
Myös vakiolla kerrottu ominaisvektori on ominaisvektori, sillä
Yhtälö voidaan kirjoittaa yhtäpitävästi muodossa tai missä on yksikkömatriisi.
Vektori on matriisin ominaisarvoa 2 vastaava ominaisvektori, sillä
Puolestaan vektori ei ole matriisin ominaisvektori, sillä Ei siis ole olemassa lukua , jolla yhtälö toteutuu.
Yllä olevasta kuvasta nähdään, että kun matriisilla operoidaan vektoria , joka on sen ominaisvektori, niin saadaan uusi vektori, joka on samansuuntainen vektorin kanssa, mutta kaksi kertaa pidempi. Matriisi on siis skaalannut tätä vektoria ominaisarvon verran.
Jos puolestaan matriisilla operoidaan vektoria , joka ei ole sen ominaisvektori, niin saatu tulovektori ei ole samansuuntainen vektorin kanssa. Matriisi on siis kiertänyt tätä vektoria.
Tämä on ominaisarvojen ja vektoreiden geometrinen tulkinta.
Matriisin ominaisvektorit ovat siis ne vektorit, jotka vain skaalautuvat eli säilyttävät suuntansa, kun niitä operoidaan matriisilla . Ominaisarvot puolestaan kertovat kuinka paljon ominaisvektoreita on skaalattu.
Karakteristinen yhtälö ja polynomi
Ominaisarvot voidaan ratkaista karakteristisen polynomin avulla. Reaaliluku on matriisin ominaisarvo jos ja vain jos
Ominaisarvo-ongelma on yleisesti missä on neliömatriisi, on vektori ja on vakio. Matriisissa on yhtä monta riviä (ja samalla saraketta) kuin vektorissa on komponentteja.
Etsitään yhtälöä muokkaamalla ongelman karakteristinen yhtälö. Jokaiselle matriisille (ja siten myös vektorille ) löytyy sopivan kokoinen yksikkömatriisi , jolle Sijoittamalla tämä ominaisarvo-ongelmaan saadaan Nyt vähentämällä puolittain yhtälön vasen puoli saadaan Tähän voidaan käyttää tietoa matriisin kääntyvyyden ja determinantin yhteydestä. Jos matriisi olisi kääntyvä, voisimme kertoa yhtälön puolittain käänteismatriisilla, ja saataisiin
Ominaisarvo-ongelmalle halutaan kuitenkin ratkaisuja, joille joten matriisi ei saa olla kääntyvä. Tiedetään, että tämä on totta jos ja vain jos Tämä on ongelman karakteristinen yhtälö.
Joskus tämä kirjoitetaan muodossa
Yllä olevaa yhtälöä kutsutaan karakteristiseksi yhtälöksi ja se on astetta oleva polynomiyhtälö, jolla on aina ratkaisua (myös kompleksiset ratkaisut ja ratkaisujen kertaluvut huomioiden) eli se voidaan kirjoittaa muodossa missä ovat matriisin ominaisarvot.
Lasketaan karakteristisen yhtälön avulla matriisin ominaisarvot.
Lasketaan matriisi :
jolloin .
Nyt karakteristinen yhtälö antaa
Matriisin ominaisarvot ovat siis 2 ja 5.
Muista, että karakteristisella polynomilla on kertaluvut ja kompleksiset ratkaisut huomioon ottaen aina täsmälleen ratkaisua. Tässä karakteristinen yhtälö on toisen asteen polynomi, joten sillä on täsmälleen 2 ratkaisua.
Aiemmin saatiin selville, että matriisin ominaisarvot ovat 2 ja 5. Etsitään seuraavaksi niitä vastaavat ominaisvektorit.
Selvitetään kummallekin ominaisarvolle ja , mitkä vektorit toteuttavat yhtälön . Aiemmin laskettiin matriisille .
Tarkastellaan ensin tapaus :
Yhtälön toteuttaa siis kaikki muotoa olevat vektorit ja esimerkiksi tuo aikaisemmassa esimerkissä oleva vektori .
Tarkastellaan sitten tapaus :
Yhtälön toteuttaa siis kaikki muotoa olevat vektorit ja esimerkiksi vektori .
Neliömatriisin diagonalisointi
Neliömatriisi on diagonalisoituva, jos on olemassa kääntyvä -neliömatriisi siten, että missä . Tällöin ovat matriisin ominaisarvot ja matriisin sarakkeina ovat matriisin ominaisvektorit.
Huomautus. Tämä voidaan myös esittää muodossa
Aiemmin saatiin selville, että matriisin ominaisarvot ovat ja . Lisäksi niille löydettiin vastaavat ominaisvektorit ja .
Matriisi on siis muotoa
Nyt suora lasku antaa
joka on diagonaalimatriisi .
Matriisien lohkomuodot
Matriisi voidaan esittää lohkomuodossa missä lohko on kokoa ja ja
Älä sekoita matriisin lohkoa alimatriisiin, jolla on sama merkintä
Matriisi voidaan jakaa lohkoihin missä , , ja .
Vaikka tässä esimerkissä kaikki lohkot ovat -matriiseja, niin matriiseja voidaan lohkottaa myös eri kokoisiksi lohkoiksi tilanteeseen sopivalla tavalla.
Edellisen matriisin voi jakaa myös vaikkapa - ja -matriiseiksi:
Lohkomatriisien kertolasku
Lohkomatriiseille pätee samat laskusäännöt kuin normaaleille matriiseillekin. Laskutoimitukset voidaan suorittaa lohkoittain. Olkoon ja
Nyt matriisien tulon lohko on
mikäli lohkojen koot ovat yhteensopivia eli kertolasku voidaan suorittaa.
Olkoon matriisit ja :
Nyt matriisien ja tulo voidaan esittää muodossa:
Lasketaan tulot:
Lopuksi lasketaan lohkot yhteen:
ja
Yhdistetään ja saadaan tulo
Lohkodiagonaalinen matriisi
Neliömatriisi on lohkodiagonaalinen, jos sillä on esitys
missä kukin on neliömatriisi ja . Tällöin voidaan merkitä .
Huomaa, että lohkomatriisit eivät välttämättä ole diagonaalimatriiseja.
Lohkodiagonaaliselle matriisille pätee: 1. Potenssit saadaan lohkojen potensseista: 2. on kääntyvä jos ja vain jos jokainen diagonaalilohko on kääntyvä. Tällöin 3. Determinantti on lohkojen determinanttien tulo:
Neliömatriisi on lohkodiagonaalinen seuraavalla lohkojaolla:
missä , ja .
Lasketaan lohkojen determinantit. Ensimmäisen lohkon determinantti on helpointa laskea ensimmäisen sarakkeen suhteen, sillä siinä on kaksi nollaa.
Matriisin determinantti on siis
Etsi matriisin käänteismatriisi, kun
Ratkaisu. Jaetaan matriisi sopiviin lohkoihin:
Saadaan diagonaalimatriisi, joka on kääntyvä sillä
ja
Lasketaan diagonaalilohkojen käänteismatriisit:
ja
Siis matriisin käänteismatriisi on
Kompleksialkioisia matriiseja
Kompleksialkioisen matriisin alkiot ovat kompleksilukuja Kompleksiarvoisilla matriiseilla operoidaan aivan samoin kuin reaaliarvoisilla. Kompleksiarvoinen matriisi voidaan hajottaa kahdeksi reaaliseksi matriisiksi ottamalla alkioiden reaaliosat ja imaginaariosat erilleen:
missä ja ovat reaalialkioisia matriiseja.
Matriisin kompleksikonjugaatti voidaan tällöin kirjoittaa
Lasketaan kahden kompleksisen matriisin ja tulo
Kompleksialkioisen neliömatriisin Hermiten konjugaatti on Hermiten konjugaatti on siis matriisin kompleksikonjugaatin transpoosi.
Hermiten konjugaatin determinantti on
Olkoon kompleksinen neliömatriisi. Tällöin on
Unitaariselle matriisille pätee
Neliömatriisin ominaisarvoille pätee: 1. Hermiittisen matriisin ominaisarvot ovat reaaliset: . 2. Antihermiittisen matriisin ominaisarvot ovat joko nollia tai täysin imaginaarisia: . 3. Unitaarisen matriisin ominaisarvot ovat joko reaalisia tai kompleksisia, mutta aina ykkösen pituisia: kaikilla .
Huomautus. Hermiittisen, antihermiittisen ja unitaarisen -neliömatriisin ominaisvektoreista , voidaan muodostaa kompleksiavaruuden ortonormitettu kanta, jolle sisätulo , kun ja , kun .
Määritä matriisin transpoosi, kompleksikonjugaatti, Hermiten konjugaatti ja käänteismatriisi.
Ratkaisu.
Transpoosissa rivit ja sarakkeet vaihtavat paikkaan, jolloin
Kompleksikonjugaatti: vaihdetaan imaginaariosan etumerkki, jolloin
Hermiten konjugaatti on transpoosin kompleksikonjugaatti eli
Käänteismatriisi lasketaan Gaussin ja Jordanin menetelmällä käyttäen rivioperaatioita
Saatu käänteismatriisi on siis
Diracin spin-matriisi
Yksi Diracin spin-matriiseista on
Määritä sen ominaisarvot ja ominaisvektorit, jälki, determinantti ja käänteismatriisi. Onko matriisi hermiittinen, antihermiittinen tai unitaarinen?
Jaetaan tehtävän helpottamiseksi matriisi lohkoihin:
Diracin spin-matriisi on siis lohkodiagonaalinen. Lohko on Tämä on eräs Paulin matriiseista, joilla on vakiintuneet merkinnät tai Lisäksi lohko on
Hyödynnetään matriisin lohkomuotoa.
Lohkomatriisin ominaisarvot ovat lohkojen ominaisarvot. Ratkaistaan siis matriisin lohkon ominaisarvot karakteristisen yhtälön avulla. Matriisin
determinantti on
Karakteristinen yhtälö on siis , jolloin kysytyt ominaisarvot ovat ja .
Ominaisarvoyhtälö on Sijoittamalla matriisi ominaisarvo(t) ja merkitsemällä saadaan missä plusmerkki vastaa ominaisarvoa ja miinusmerkki ominaisarvoa Saadaan ja
Voidaan valita jolloin eli ja ovat kaksi lineaarisesti riippumatonta vektoria. Toisaalta voidaan valita ja eli ja ovat kaksi lineaarisesti riippumatonta vektoria.
Näin saadaan kaikki neljä lineaarisesti riippumatonta vektoria, joista ja vastaavat ominaisarvoa ja ja arvoa
Jälki
Lohkomatriisin jälki on diagonaalilohkojen jälkien summa eli Matriisin lohkon jälki on joten Diracin matriisin jälki on Tämän voi todeta myös suoraan matriisista summaamalla diagonaalialkiot.
Determinantti
Hyödynnetään matriisin lohkomuotoa.
Lohkodiagonaalisen matriisin determinantti on diagonaalilohkojen determinanttien tulo eli
Matriisin lohkon determinantti on joten Diracin matriisin determinantti on .
Hyödynnetään jälleen matriisin lohkoja.
Käänteismatriisi
Käänteismatriisi saadaan sijoittamalla lohkojen tilalle niiden käänteismatriisit
Koska lohkot ovat samat, on niiden käänteismatriisikin sama. Merkitään lohkojen käänteismatriisia jolloin käänteismatriisin määritelmän mukaan saadaan matriisien kertolasku Laskemalla tämä saadaan eli
Saatu käänteismatriisi lohkolle on siis
jolloin siis .
A on hermiittinen, sillä
jolloin siis .
A on unitaarinen, sillä .
Kompleksinen sisätulo
Kun vektoreiden komponentteina on kompleksilukuja, täytyy määritellä kompleksivektoreiden sisätulo. Tämä on eräs yleistys tutusta reaalisten vektorien pistetulosta.
Olkoot esimerkiksi kaksi vektoria Näiden kompleksinen sisätulo on
Yleisesti olkoot kaksi avaruuden kompleksivektoria missä ja missä Kompleksinen sisätulo on missä on kompleksikonjugaatti.
Kompleksisten vektorien ja sisätulo voidaan kirjoittaa myös matriisitulona:
Vektorin pituus (eli normi) on
Näille sivuille inspiraatiota on haettu pääasiassa alla olevista lähteistä:
- Petri Juutinen: Lineaarinen algebra ja geometria 1. Luentomoniste, 2019.
- Petri Juutinen: Lineaarinen algebra ja geometria 2. Luentomoniste, 2020.
- Emma Leppälä: Matriisilaskenta. Luentomoniste, 2019.
- Juha Merikoski: Lineaarialgebra. Luentodiat, 2016.
These are the current permissions for this document; please modify if needed. You can always modify these permissions from the manage page.