MAA8 Tilastot ja todennäköisyys

Keskeiset sisällöt ja tavoitteet

1. Tilastot

Tilastoitavat suureet voivat olla joko diskreettejä tai jatkuvia. Diskreetit muuttuja voi olla numeerinen, esimerkiksi yksilöiden lukumäärä, tai ei-numeerinen, esimerkiksi vaatekoko.

Jatkuva muuttuja voi saada ainakin teoriassa minkä tahansa lukuarvon tietyltä välilä. Vaikkapa tutkittaessa suomalaisten ikää muuttuja voi saada minkä tahansa arvon esim. väliltä \([0,100]\).

Joissain tutkimuksissa ei ole mahdollista asettaa havaintoja suuruusjärjestykseen. Tällöin muuttujia tarkastellaan vain laatuasteikolla, jolloin mediaania tai keskiarvoa ei voida laskea.

1.1 Keskiluvut

Tilastoaineistot ovat usein erittäin laajoja, jonka vuoksi niiden tiivistäminen on tarpeellista. Tilastoaineistoja voidaan tiivistää esimerkiksi erilaisten tunnuslukujen avulla, joita ovat mm. keski- ja hajontaluvut.

Tilastoaineistoissa tiettyjen arvojen lukumäärää kutsutaan frekvensseiksi. Esimerkiksi, kuinka moni oppilas luokassa sai arvosanan 8.

Frekvenssin lisäksi tilastoista voidaan laskea myös summafrekvenssit, suhteelliset frekvenssit ja suhteelliset summafrekvenssit.

Summafrekvenssit kuvaavat tiettyyna arvoon mennessä kertyneitä lukumääriä ja suhteelliset frekvenssit lukumäärien prosenttiosuuksia kokonaisuudesta.

Keskiarvo

Olkoon luvut \(x_1, x_2, x_3, ..., x_n\). Näiden lukujen keskiarvo on \[\begin{align*} \overline{x}=\dfrac{x_1+x_2+x_3+...+x_n}{n}=\dfrac{\displaystyle\sum_{i=1}^{n}x_i}{n} \end{align*}\]

Moodi ja mediaani

Moodi, eli tyyppiarvo, on aineistossa eniten esiintyvä luku tai luvut.

Mediaani on suuruusjärjestyksessä keskimmäinen luku. Jos lukuja on parillinen määrä, mediaani on kahden keskimmäisen luvun keskiarvo.

Tilastoaineistoa voi olla tarpeen luokitella, eli tiivistää. Tämä parantaa luettavuutta, mutta sen jälkeen yksittäiset havainnot eivät ole enää näkyvissä lukijalle.

Luokitellussa aineistossa voi olla mediaaniluokka, johon mediaani kuuluu. Mediaaniluokka määritetään suhteellisten frekvenssien avulla.

Tyyppiarvoluokka on vastaavasti se luokka, johon kuuluvia havaintoja on eniten.

1.2 Hajontaluvut

Tilastoaineiston havaintoarvot voivat vaihdella toisistaan paljon. Tätä kutsutaan hajonnaksi. Vaihteluväli on se väli, joka on pienimmän ja suurimman arvon välillä.

Keskihajonta

Olkoon luvut \(x_1, x_2, x_3,...x_n\). Näiden lukujen keskihajonta \(s\) on \[\begin{align*} s&=\sqrt{\dfrac{(x_1-\overline{x})^{2}+(x_2-\overline{x})^{2}+(x_3-\overline{x})^{2}+...+(x_n-\overline{x})^{2}}{n}}\\ &=\sqrt{\dfrac{\displaystyle\sum_{i=1}^{n}(x_{i}-\overline{x})^{2}}{n}}, \end{align*}\] tässä \(\overline{x}\) on lukujen \(x_1,x_2,x_3,...,x_n\) keskiarvo.

Keskihajonta voidaan myös merkitä sigmalla \(\sigma\).

Keskihajonta kuvaa, kuinka paljon tilaston yksittäiset havaintoarvot poikkeavat tilaston keskiarvosta.

Poikkeamien keskiarvoa \(\dfrac{\displaystyle\sum_{i=1}^{n}(x_i-\overline{x})^{2}}{n}\) kutsutaan varianssiksi.

Jos tutkittavana on jokin suuri joukko, esim. kaikki ihmiset Suomessa, ei ole järkevää suorittaa tutkimusta kaikille vaan ottaa tästä perusjoukosta pienempi joukko, eli otos, jolle tutkimus suoritetaan.

Otoksesta saaduista tuloksista tehdään oletukset liittyen koko perusjoukkoon.

Otoskeskihajonta

Otoskeskihajonta poikkeaa keskihajonnasta ainoastaan otoksen koossa: otoksen koko ei ole \(n\) vaan \(n-1\). \[\begin{align*} s_{n-1}=\sqrt{\dfrac{\displaystyle\sum_{i=1}^{n}(x_{i}-\overline{x})^{2}}{n-1}} \end{align*}\]

Normitettu arvo

\[\begin{align*} z=\dfrac{x-\overline{x}}{s}, \end{align*}\] tässä \(\overline{x}\) on tilaston keskiarvo ja \(s\) keskihajonta.

Normitetun arvon avulla voidaan tarkastella sitä, kuinka monen keskihajonnan päässä keskiarvosta muuttujan arvo on. Tätä voidaan hyödyntää esimerkiksi kahden eri muuttujan vertailussa: kumpi poikkeaa enemmän keskiarvosta?

1.2.1 Esimerkki: Leikkipuistossa

1.2 Tilastojen havainnollistaminen

Tilastoja voidaan havainnollistaa erilaisten diagrammien avulla. Diagrammityyppi valitaan sen mukaan, mihin lukijan tulisi kiinnittää tuloksissa huomio.

  • Pylväsdiagrammi soveltuu hyvin frekvenssien havainnollistamiseen Tilasto 1
  • Viivakuviolla havainnollstetaan kehityssuuntaa sekä vaihtelua esim. ajan suhteen
Tilasto 2
Tilasto 2
  • Ympyräkuviota voidaan hyödyntää eri kokonaisuuksien havainnollistamiseen Tilasto 3

Kertymäkuvaajaa hyödynnetään summafrekvenssin ja suhteellisen summafrekvenssin havainnollistamiseen. Jatkuvan muuttujan kuvaaja on murtoviiva, ja diskreetin muuttujan kuvaaja on porrastettu.

1.3 Korrelaatio ja lineaarinen regressio

Useimpiin tutkimuksiin sisältyy kysymys siitä, miten kaksi tai useampi eri asia on riippuvainen toisistaan. Tällaista kahden ilmiön välistä tilastollista riippuvuutta kutsutaan korrelaatioksi.

Riippuvuuden selvittäminen auttaa ennustamaan sekäa arvioimaan toisen tilastomuuttujan suuruutta.

Kun tilastomuuttujien välillä on lineaarista riippuvuutta, puhutaan tällöin lineaarisesta regressiosta.

Olkoon tilastomuuttujat \(x\) ja \(y\). Näiden tilastomuuttujien vastinparit \((x_iy_i)\), \(i=1,2,...,n\).

Arvoparien joukkoa approksimoivaa suoraa kutsutaan regressiosuoraksi, jonka yhtälö on \(y=ax+b\). \[\begin{align*} a=\frac{\sum y_i-b\sum x_i}{n}\;\;\;\;\;\;\text{ ja }\;\;\;\;\;\;b=\frac{n\sum x_{i}y_{i}-(\sum x_i)(\sum y_i)}{n\sum x^{2}_{i}-(\sum x_{i})^{2}} \end{align*}\]

Kahden tilastomuuttujan välistä tilastollisen riippuvuuden suuruutta kuvaa korrelaatiokerroin \(r\). Mitä suurempi korrelaatokerroin, sitä vahvempi on tilastollinen riippuvuus.

Korrelaatiokerroin

\[\begin{align*} r=\dfrac{\sum(x_i-\overline{x}(y_i-\overline{y})}{\sqrt{\sum(x_i-\overline{x})^{2}\sum(y_i-\overline{y})^{2}}} \end{align*}\]

Korrelaatiokerroin \(r\) on aina välillä \([-1,1]\), ja mitä lähempänä korrelaatiokerroin \(r\) on lukua 1, sitä suurempi korrelaatio on.

Korrelaatiokerroin voi olla negatiivista tai positiivista. Negatiivinen korrelaatio tarkoittaa sitä, että muuttujan \(x\) kasvaessa muuttuja \(y\) vähenee. Vastaavasti positiivisen korrelaation tilanteessa muuttujan \(x\) kasvaessa myös muuttuja \(y\) kasvaa.

Korrelaation voimakkuus
Korrelaation voimakkuus

Esimerkki

Ravihevosen väliaikoja 100 metrin matkalta on taulukoitu seuraavaasti: Taulukko, jossa tolpat määräävät sarakkeiden paikat.

Open plugin

Muodostetaan väliaikojen regressiosuora sekä lasketaan sen korrelaatiokerroin.

RATKAISU:

Taulukosta pisteparit ovat \((10;0,68),(20;1,48),...,(100;7,70)\).

Kirjataan nämä taulukkosovellukseen ja saadaan

2. Todennäköisyys

  • klassinen todnäk ja tilastollinen todnäk
  • laskusäännöt
  • kertolaskusääntö ja tapahtumien riippumattomuus
  • yhteenlaskusääntö

2.1 Tilastollinen todennäköisyys

Frekvenssi ilmoitti tietyn havainnon lukumäärän tutkimuksessa. Kun tätä samaa tutkimusta toistetaan useasti, huomataan suhteelisen frekvenssin keskittyvän tietyn luvun läheisyyteen. Tätä tapahtuman suhteellista frekvenssiä kutsutaan tilastolliseksi todennäköisyydeksi.

Tilastollinen todennäköisyys

\[\begin{align*} P(A)=\dfrac{f}{n}, \end{align*}\] jossa \(A\) on tapahtuma, \(f\) on frekvenssi (eli tapahtuman \(A\) esiintymiskertojen lukumäärä) ja \(n\) on koko aineiston lukumäärä.

Kirjain \(P\) tulee englannin kielen sanasta probability eli todennäköisyys.

Varman tapahtuman todennäköisyys on \(100\%=1\) ja mahdottoman tapahtuman todennäköisyys on vastaavasti \(0\%=0\).

2.2 Klassinen todennäköisyys

Tapahtuma \(A\) voi olla yksi mahdollisista tapauksista. Esimerkiksi nopassa on kuusi tahkoa, joten on mahdollista heittää mikä tahansa luvuista \(1-6\).

Nämä yksittäiset tapaukset: \(P(\)Nopan heitolla saadaan silmäluvuksi 1\()\), \(P(\)Nopan heitolla saadaan silmäluvuksi 2\()\),... ovat nimeltään alkeistapauksia.

Suotuisaksi alkeistapaukseksi kutsutaan sitä tulosta, jolla saadaan haluttu tapahtuma. Esimerkiksi tapahtuman \(P(\)Nopan heitolla saadaan silmäluvuksi 2\()\) suotuisa alkeistapaus on heittää silmäluku 2. Tämän tapahtuman todennäköisyys on \(\frac{1}{6}\).

Klassinen todennäköisyys

Tapahtuman \(A\) klassinen todennäköisyys on \[\begin{align*} P(A)=\dfrac{\text{Suotuisten alkeistapausten lukumäärä}}{\text{Kaikkien alkeistapausten lukumäärä}}=\dfrac{k}{n} \end{align*}\]

Geometrinen todennäköisyys

Myös geometrisia ominaisuuksia voidaan pitää alkeistapauksina. Tällöin puhutaan geometrisesta todennäköisyydestä: \[\begin{align*} P(A)=\dfrac{\text{Suotuisa mitta}}{\text{Koko mitta}}=\dfrac{k}{n} \end{align*}\]

Vinkki: Merkintään \(P(A)\) kannattaa kirjoittaa \(A\):n tilalle jokin tarkentavampi nimi jos tehtävässä on kyse jostain tietystä ilmiöstä, tämä helpottaa muistamista. (Esim. Jos tehtävässä nostetaan mustia, punaisia ja vihreitä sukkia, mustan sukan nostamisen alkeistapauksen nimi voisi olla \(P(musta)\). )

2.2.1 Esimerkki: Nysse

2.3 Kertolaskusääntö

Tutkittavat tapaukset voivat olla toisistaan riippuvaisia tai riippumattomia. Esimerkiksi heitettäessä nopalla kaksi kertaa, peräkkäisten heittojen tulokset ovat toisistaan riippumattomia.

Riippumattomien tapahtumien kertolaskusääntö

Olkoon tapahtumat \(A\) ja \(B\), näille tapahtumille \[\begin{align*} P(A \text{ ja }B)=P(A)\cdot P(B) \end{align*}\]

Joko tai -tilanne on esimerkki toisistaan riippuvaisista tapahtumista: joko ihminen elää tai on kuollut.

Toinen mahdollisuus toisistaan riippuvista tapahtumista on se, ettei tapahtumaa \(B\) voi tapahtua ellei myös tapahtuma \(A\) tapahdu. Esimerkiksi kahden marmorikuulan nostaminen maljasta peräjälkeen palauttamatta ensimmäistä marmorikuulaa takaisin maljaan.

Yleinen kertolaskusääntö

Olkoon tapahtumat \(A\) ja \(B\), näille tapahtumille \[\begin{align*} P(A\text{ ja }B)=P(A)\cdot P(B|A) \end{align*}\]

Kertolaskusäännössä ei ole väliä tapahtumien järjestyksellä: \[\begin{align*} P(A\text{ ja }B)=P(A)\cdot P(B|A) \Leftrightarrow P(B\text{ ja }A)=P(B)\cdot P(A|B) \end{align*}\]

Tapahtumat \(A\) ja \(B\) ovat riippumattomia täsmälleen silloin, kun \(P(A\text{ ja }B)=P(A)\cdot P(B)\).

2.4 Yhteenlaskusääntö

Yhteenlaskusääntö

Olkoon tapahtumat \(A\) ja \(B\), näille tapahtumille \[\begin{align*} P(A\text{ tai }B)=P(A)+P(B)-P(A\text{ ja }B) \end{align*}\]

a

12 Mar 21

Yhteenlaskusäännössä \(P(A\text{ tai }B)\) tarkoittaa siis "Joko A tai B tai molemmat".

Yhteenlaskusääntö erillisille tapahtumille

Tapahtumat \(A\) ja \(B\) ovat erilliset tapahtumat, niille \[\begin{align*} P(A\text{ tai }B)=P(A)+P(B) \end{align*}\]

2.4.1 Esimerkki: Hedelmäkarkkeja ja lakritsia

3. Kombinatoriikka

Kombinatoriikassa tutkimuksen kohteena on se, kuinka monella eri tavalla jokin joukko voidaan jakaa osiin. Tähän vaikuttaa se, onko järjestyksellä väliä vai ei.

3.1 Tuloperiaate

Kun useasta vaihtoehdoista valitaan aina yksi useassa eri vaiheessa. Esimerkiksi asukokonaisuuden valitseminen.

Tuloperiaate

Vaiheessa \(i\) on vaihtoehtoja \(n_i\) kappaletta. Yhteensä valintoja tehdään \(k\) kappaletta, tällöin mahdollisia lopputuloksia on yhteensä \(n_1\cdot n_2\cdot n_3\cdot ... n_k\) kappaletta.

3.1.1 Esimerkki: Ravintolassa

3.2 Permutaatio

Tuloperiaatetta hyödynnetään esimerkiksi erilaisten permutaatioiden lukumäärän laskemiseen. Permutaatio tarkoittaa joukon alkioista muodostettua jonoa.

Permutaatioiden lukumäärä

Joukossa on \(n\) alkiota. Tämän joukon permutaatioiden lukumäärä on \[\begin{align*} n!=n\cdot(n-1)\cdot(n-2)\cdot...\cdot2\cdot1 \end{align*}\]

Joukosta voidaan tehdä myös osajoukko, jossa ei ole kaikkia joukon alkioita, vaan ainoastaan \(k\) alkiota. Tällöin puhutaan joukon \(k\)-permutaatiosta (tai \(k\)-variaatioksi).

\(k\)-permutaatioiden lukumäärä

Joukossa on \(n\) alkiota ja \(k\leq n\). Joukon \(k\)-permutaatioiden lukumäärä on \[\begin{align*} (n)_k=n\cdot(n-1)\cdot...\cdot(n-k+1)=\dfrac{n!}{(n-k)!} \end{align*}\]

3.2.1 Esimerkki: CD-levyn kappaleet

3.3 Kombinaatio

Jos joukosta, jossa on \(n\) yksilöä, valitaan \(k\) yksilöä ja muodostetaan osajoukko, puhutaan \(k\)-kombinaatiosta.

\(k\)-kombinaatio

Joukossa on \(n\) alkiota, ja \(k\leq n\). Joukosta tehtyjen eri kombinaatioiden lukumäärä on \[\begin{align*} {{n}\choose{k}}=\dfrac{n!}{k!\cdot(n-k)!} \end{align*}\]

Lukua \({n}\choose{k}\) kutsutaan binomikertoimeksi, ja se kertoo, kunka monella erilaisella tavalla \(n\):stä alkiosta voidaan valita \(k\) alkiota.

3.3.1 Esimerkki: Lotto

3.4 Toistokoe

Nopanheitto usesasti peräkkäin on esimerkki toistokokeesta. Kun koetta toistetaan \(n\) kertaa, voidaan laskea todennäköisyys \(k\) onnistumiselle, jos jokaisen onnistumisen todennäköisyys on \(p\).

# linkkibinomitod
# linkki34
Binomitodennäköisyys

\[\begin{align*} P(k\text{ onnistumista})={{n}\choose{k}}p^{k}(1-p)^{n-k} \end{align*}\]

3.4.1 Esimerkki: Kauransiemenet

4. Todennäköisyysjakauma

  • diskreetin jakauman odotusasrvo

Jakauma on helpointa havainnollistaa taulukoimalla kaikki eri arvot, joita satunnaismuuttuja voi saada. Taulukkoon kirjoitetaan jokaisen arvon todennäköisyys. Satunnaismuuttujan jakauma muodostuu siis eri satunnaismuuttujan arvojen todennäiköisyyksistä.

Tutki erilaisia jakaumia GeoGebralla!

https://www.geogebra.org/m/fusDCEhh

4.1 Diskreetti todennäköisyysjakauma

Satunnaismuuttuja on diskreetti, jos se saa ainoastaan yksittäisiä arvoja, esim. 0,1,2. Satunnaismuuttujan yksittäisten arvojen \(x_i\) todennäköisyyksiä \(p_i\) kutsutaan pistetodennäköisyyksiksi.

Pistetodennäköisyys

Olkoon satunnaismuuttuja \(X\) ja sen eri mahdolliset arvot ovat \(x_1,x_2,x_3,...,x_n\).

Nyt satunnaismuuttujan jakauman muodostavien pistetodennäköisyyksien \(p_1,p_2,p_3,...,p_n\)(järjestyksessä) summa on 1. \[\begin{align*} p_1+p_2+p_3+...+p_n=1 \end{align*}\]

Satunnaismuuttujalle \(X\) voidaan määrittää odotusarvo, eli minkä arvon satunnaismuuttuja todennäköisimmin saa. Tämä määritetään laskemalla todennäköisyysjakauman keskiarvo.

Diskreetin satunnaismuuttujan odotusarvo

Olkoon satunnaismuuttuja \(X\), tietyn arvon \(x_{i}\) saamisen todennäköisyys \(p_i\). Nyt odotusarvo on \[\begin{align*} E(X)=\sum_{i=1}^{n}p_{i}x_{i} \end{align*}\] Odotusarvoa voidaan myös merkitä kreikkalaisella kirjaimella myy, \(\mu\).

Satunnaismuuttujan saamat arvot voivat vaihdella, eli jakaumassa voi olla hajontaa.

Diskreetin satunnaismuuttujan keksihajonta

Olkoon satunnaismuuttuja \(X\) ja sen saaman arvon \(x_i\) todennäköisyys \(p_i\). Nyt satunnaismuuttujan keskihajonnalle \[\begin{align*} D(X)=\sqrt{\sum_{i=1}^{n}p_i(x_i-E(X))^{2}} \end{align*}\] Keskihajontaa voidaan merkitä myös kirjaimella sigma, \(\sigma\).

Kertymäfunktio voidaan laskea, jos tiedetään satunnaismuuttujan \(X\) arvojen pistetodennäköisyydet.

Diskreetin satunnaismuuttujan pistetodennäköisyydet vastaavat diskreetin tilastomuuttujan suhteellisia frekvenssejä. Edelleen satunnaismuuttujan kertymäfunktion arvot vastaavat tilastomuuttujan suhteellisia summafrekvenssejä.

Diskreetin satunnaismuuttujan kertymäfunktio

Jos satunnaismuuttuja on \(X\) ja se saa arvot \(x_i\) todennäköisyyksillä \(p_i\), niin sen kertymäfunktio on \[\begin{align*} F(x)=P(X\leq x), \end{align*}\] jossa \(x\in\R\).

Toisin sanoen funktion \(F\) arvo kohdassa \(x\) on todennäköisyys sille, että satunnaismuuttuja \(X\) saa korkeintaan arvon \(x\).

4.1.1 Esimerkki: Korttipeli

4.2 Binomijakauma

Kun koetta toistetaan \(n\) kertaa ja onnistumisen mahdollisuus jokaisella kerralla on \(p\), niin satunnaismuuttujan \(X\) (onnistumisien lukumäärä) voi saada arvot \(0,1,2,...,n\).

Jokaiselle arvolle voidaan laskea todennäköisyys binomitodennäköisyyden avulla, ja sanotaan satunnaismuuttujan \(X\) noudattavan binomitodennäköisyysjakaumaa parametrein \(n\) ja \(p\).

Tästä käytetään merkintää \(X\sim \text{Bin}(n,p)\).

Jos satunnaismuuttuja \(X\) noudattaa binomijakaumaa \(X\sim\text{Bin}(n,p)\), niin sen odotusarvo on satunnaismuuttujan arvo kerrottuna sen todennäköisyydellä.

Binomijakauman odotusarvo ja keskihajonta

Jos satunnaismuuttuja \(X\) noudattaa binomijakaumaa, niin tällöin sen odotusarvo on \[\begin{align*} E(X)=np. \end{align*}\] Jakauman keskihajonta on tällöin \[\begin{align*} D(X)=\sqrt{np(1-p)} \end{align*}\]

Tutki binomijakaumaa GeoGebralla!

Binomijakauman kertymäfunktio voidaan laskea:

Binomijakauman kertymäfunktio

\[\begin{align*} F(k)=P(X\leq k)=\sum_{i=1}^{n}{{n}\choose{i}}p^{i}(1-p)^{n-1} \end{align*}\]

4.2.1 Esimerkki: Patojen lukumäärä

4.3 Jatkuva todennäköisyysjakauma

Tutkittaessa esimerikiksi ihmisen pituutta satunnaismuuttuja voi saada reaaliluvun eri arvoja tietyltä väliltä. Tällaista tilannetta mallinnetaan jatkuvasti jakautuneiden satunnaismuuttujien avulla.

Toisin kuin diskreetissä jakaumassa, jatkuvassa jakaumassa satunnaismuuttujan eri arvojen todennäköisyyksiä ei voida esittää pistetodennäköisyyksien avulla.

Satunnaismuuttujan yksittäisen arvon todennäköisyys on nolla.

Jakautumisen kuvaamiseen käytetään tiheysfunktiota.

Jatkuva jakauma

Olkoon satunnaismuuttuja \(X\) ja funktio \(f\) sen tiheysfunktio. Tällöin kaikilla luvuilla \(a<b\) tapahtuman \(a\leq X\leq b\) todennäköisyys on sama kuin funktion \(f\) kuvaajan ja \(x\)-akselin välin \(a\leq x\leq b\) väliin jäävä pinta-ala.

Jos tiheysfunktio \(f\) on jatkuva kyseisellä välillä, voidaan pinta-ala laskea integroimalla. Jos välillä on epäjatkuvuuskohtia, pinta-ala tulee laskea erillisissä osissa.

Kertymäfunktio siis osoittaa nimensä mukaisesti, paljonko todennäköisyyttä "on kertynyt" tiettyyn kohtaan \(x=a\) mennessä.

Kertymäfunktion määritelmä

Olkoon satunnaismuuttuja \(X\), jolle kertymäfunktio on \[\begin{align*} F(x)=P(X\leq x), \end{align*}\] jossa \(x\in\R\).

4.3.1 Esimerkki: Todennäköisyyden määrittäminen kertymäfunktion avulla

4.4 Normaali todennäköisyysjakauma

Tutki normaalijakauman ja binomijakauman yhteyttä GeoGebralla!

Normaalijakauma on jatkuva jakauma, mutta se on tilastotieteen ja todennäköisyyslaskennan kannalta niin oleellinen, että se on eritelty omaksi luvukseen. Normaalijakaumaa kutsutaan myös Gaussin jakaumaksi tai Gaussin kellokäyräksi.

Normaalijakauman määritelmä

Jos satunnaismuuttujan tiheysfunktio on \[\begin{align*} f(x)=\dfrac{1}{\sigma\sqrt{2\pi}}e^{-\dfrac{(x-\mu)^{2}}{2\sigma^{2}}}, \end{align*}\] jossa \(\mu\) on satunnaismuuttujan \(X\) odotusarvo ja \(\sigma\) keskihajonta, niin satunnaismuuttuja \(X\) on normaalisti jakautunut.

Tällöin merkitään \(X\sim N(\mu,\sigma)\)

Jatkuvan jakauman keskihajonta ja odotusarvo määräävät tiheysfunktion \(f\) muodon ja sijainnin. Jakauma on symmetrinen odotusarvon \(\mu\) suhteen ja keskihajonta \(\sigma\) kuvaa jakauman leveyttä.

Standardinormaalijakauma \(N(0,1)\)

Olkoon satunnaismuuttuja \(X\), joka on normaalisti jakautunu parametrein \(\mu\) ja \(\sigma\). Nyt normitettu satunnaismuuttuja \[\begin{align*} Z=\dfrac{X-\mu}{\sigma} \end{align*}\] noudattaa standardi normaalijakaumaa. Merkintä on \(Z\sim N(0,1)\).

Standardinormaalijakaun ominaisuuksille käytettään kreikkalaista kirjainta fii: tiheysfunktiota merkitään fiillä \(\varphi\) ja kertymäfunktiota isolla fiillä \(\Phi\).

4.4.1 Esimerkki: Tietokoneen akunkesto

Tehtäviä

1. Tehtävä

Niklas ajatteli tehdä tutkimuksen siitä, paljonko muut 17-vuotiaat tienaavat kesätöiden aikana. Hän toteuttaa tutkimuksensa kyselemällä muutamalta ystäviltään heidän palkkatietojaan ja listaamalla ne. Tämän jälkeen Niklas laskee palkkojen keskiarvon.

Pohdi tutkimuksen asetelmaa ja vastaa kysymyksiin.

a.
# MAA8_1a
b.

Onko Niklaksen tutkimus pätevä? Perustele vastauksesi.

# MAA8_1b

 

2. Tehtävä

Taulukko
Taulukko
a.

Montako mökkiä on yllä olevan taulukon kaupungeissa keskimäärin?

# MAA8_2a

Anna vastaus yhden desimaalin tarkkuudella.

Avaa tehtävä viemällä kursori tähän

 

b.

Mikä on tilaston moodi?

# MAA8_2b
c.

Millä todennäköisyydellä sijaitsee kaupungissa, jossa on yli 8000 mökkiä?

# MAA8_2c

Anna vastaus yhden desimaalin tarkkuudella.

Avaa tehtävä viemällä kursori tähän

 

vastaus prosennteina

21 Jan 20
d.

Millä todennäköisyydell mökki sijaitsee joko Kuusamossa tai Raaseporissa?

# MAA8_2d

Anna vastaus yhden desimaalin tarkkuudella.

Avaa tehtävä viemällä kursori tähän

 

3. Tehtävä

Kala ui kohti verkon reunaa. Verkko näyttää kalasta katsottuna pelkältä kaarevalta narulta, sillä se ui kohtisuorassa verkon reunaa vastaan.

Verkon alareuan on kiinni pohjassa ja kohoaa hieman kaarevasti kohti pintaa.

Jos kala oletetaan niin pieneksi, ettei sillä ole itsessään pinta-alaa ja verkon nousevan funktion \(y=x^{2}\) mukaisesti.

Kala ui silmät kiinni kohti verkkoa, millä todennäköisyydellä se väistää verkon ja ui sen ali?

Verkko on kiini pohjassa kohdassa (0,0).
Verkko on kiini pohjassa kohdassa (0,0).
# MAA8_3

Anna vastaus prosenttin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

vadtaus?

21 Jan 20

4. Tehtävä

a.
# MAA8_4a

Open plugin

b.
Image
Image

Markuksen kesätyömatkalla on kolmet liikennevalot, jotka toimivat toisistaan riippumattomasti. Ensimmäiset valot ovat punaiset 10 sekuntia minuutissa, toiset valot 8 sekuntia ja kolmannet 20 sekuntia.

Millä todennäköisyydellä markus joutuu pysähtymään punaisiin valoihin täsmälleen kerran?

# MAA8_4b

Anna vastaus prosentin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

5. Tehtävä

Todennäköisyyslaskennan käsitteet perustuvat joukko-oppiin. Esimerkiksi tuttu reaalilukujen joukko \(\R\) on joukko, jonka alkiona ovat kaikki reaaliluvut. Joukon koko voi olla äärellinen tai ääretön.

Eräs abiluokka jakautuu seuraavasti joukkoihin. Yhteensä oppilaita luokalla on 8.

a.
# MAA8_5a
b.

Eräät joukko-opin peruslait ovat de Morganin lait: \[\begin{align*} \overline{A\cap B}=\overline{A}\cup\overline{B}\;\;\;\;\;\;\; \text{ja}\;\;\;\;\;\;\; \overline{A\cup B}=\overline{A}\cap\overline{B}. \end{align*}\]

Olkoon \(M\) perusjoukko sekä lisäksi \(A\subset M\) ja \(B\subset M\).

Todista de Morganin lait hyödyntämällä Venn-diagrammia.

Avaa Abitti-editori tästä

Avaa GeoGebra tästä

Halutessasi voit ottaa kuvakaappauksen abitti-editorista ja palauttaa tehtävän tänne

6. Tehtävä

Lotto-pelissä pelaaja valitsee \(1-40\) numerosta seitsemän. Viikottain suoritetaan arvonta, jossa kone arpoo seitsemän lukua ja jos omat valintasi täsmäävät arvottujen lukujen kanssa, voitat pääpalkinnon.

a.

Montako erilaista 7-kombinaatiota luvuista voidaan muodostaa?

# MAA8_6a

Anna vastaus prosentin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

b.

Mikä on todennäköisyys "Kaikki seitsemän oikein"-riville?

# MAA8_6b

Anna vastaus prosentin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

c.

Mikä on todennäköisyys, että saat 5 numeroa ja yhden lisänumeron oikein?

# MAA8_6c

Anna vastaus prosentin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

7. Tehtävä

a. Pascalin kolmio

Pascalin kolmio voidaan kirjoittaa kokonaislukuina tai binomikertoimien avulla. Ylläolevassa kuvassa kolmio on täytetty binomikertoimien avulla.

Binomin potenssin \((a+b)^{n}\) kertoimet saadaan Pascalin kolmion riviltä \(n\).

Täydennä taulukkoon binomikerrointa vastaava lukuarvo.

# MAA8_7a

Open plugin

Kirjoita auki lauseke \((3x+2)^{4}\).

# MAA8_7b

Kirjoita tähän vastauksesi.

=

 

Vihje

b. Poissonin jakauma
Open plugin

Tutki Poissonin jakaumaa GeoGebralla

Jos jokin tapahtuma esiintyy useita kertoja toisistaan riippumatta, esiintymisten lukumäärä noudattaa Poissonin jakaumaa parametrilla \(\lambda\). Esiintymisen lukumäärää merkitään lambdalla \(\lambda\).

Satunnaismuuttuja \(X\) noudattaa Poissonin jakaumaa parametrein \(\lambda\), jos sen pistetodennäköisyydet ovat \(P(X=k)=e^{-\lambda}\dfrac{\lambda^{k}}{k!}\), jossa \(k=0,1,2,3...\).

Pankkiin saapuu arkiaamuisin keskimäärin 5 asiakasta yhden tunnin aikana. Henkilökunnan lukumäärä mitoitettiin niin, että yksi työntekijä voi palvella tunnissa 6 asiakasta.

Oletetaan, että asiakkaiden saapuminen pankkiin on toisistaan riippumatonta ja noudattaa Poissonin jakaumaa.

Arvioi Poissonin jakauman avulla riski, että pankkiirien palvelukapasiteetti ylittyy seuraavana arkiaamuna.

# MAA8_7d

Anna vastaus prosentin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

8. Tehtävä

Ilmavoimilla on omat vaatimukset näkemiselle, ja kaikki halukkaat eivät välttämättä pääse kouluttautumaan esimerkiksi lentäjiksi. Näön tarkkuuden on oltava vähintään 0,5 ja laseilla korjattuna 1,0. Taittovihrettä saa olla maksimissaan +2,5– -1,5 ja värinäön on oltava virheetön. (Lähde: Piilolinssioptikko)

Yhdeksällä prosentilla miehistä on puna-vihersokeus. Millä todennäköisyydellä 100 sotilaasta ainakin kolmella on puna-vihersokeus?

# MAA8_8

Anna vastaus prosentin kymmenesosan tarkkuudella ilman yksikköä

Avaa tehtävä viemällä kursori tähän

 

Vanhoja YO-tehtäviä

1.

Lotto-peli alkoi Suomessa vuonna 1971, ja sen sääntöjä on muutettu useita kertoja vuosien varrella. Viimeisin sääntöuudistus tehtiin vuoden 2016 lopussa.

Ennen uudistusta arvottiin 7 varsinaista ja 2 lisänumeroa 39 numerosta. Uudistuksen jälkeen arvotaan 7 varsinaista ja vain 1 lisänumero 40 numerosta. Seuraavassa loton pelaaja täyttää yhden lottorivin eli käytännössä valitsee 7 numeroa.

Laske tuloksen "\(6+1\)" todennäköisyys ennen uudistusta ja sen jälkeen. Tässä "\(6+1\)" tarkoittaa tulosta, jossa on kuusi varsinaista ja yksi lisänumero oikein. [K18/7]

Ratkaisu

2.

Tavallista noppaa heitetään kolme kertaa, jolloin saadaan heittojärjestykseessä luvut \(a,b,c\). Laske seuraavien tapahtumien todennäköisyydet:

  1. Jono \((a,b,c)\) on aidosti kasvava ja artimeettinen
  2. Jono \((a,b,c)\) on geometrinen. [S17/7]

Ratkaisu

3.

Arkikielessä keskimääräisyyteen liittyvät käsitteet keskiarvo ja mediaani menevät usein sekaisin. Tässä tehtävässä "keskimääräisellä" tarkoitetaan keskiarvoa.

  1. Valtion liikenneturvallisuuslaitos pyysi taksinkuljettajia arvioimaan ajotaitoaan kouluarvosanoin \(4-10\). Vastaukset tuhannelta kuljettajalta näkyvät oheisessa pylväsdiagrammissa, joka perustuu kiireisen toimittajan hätäisiin muistiinpanoihin. Arvioi kuvion perusteella arvosanan neljäsosan tarkkuudella, mikä oli tutkimuksen mukaan keskimääräisen kuljettajan ajotaidon arvosana.

  2. Sama kysely tehtiin tuhannelle tavalliselle autoilijalle. Anna perusteltu esimerkki sellaisesta jakaumasta (mahdollisesta tuloksesta), jossa vähintään \(80\%\) vastaajista arvioi olevansa keskimääräistä parempia kuljettajia. [K17/11]

Ratkaisu

4.

Alla oleva kuvio esittää pienen kaupungin katuverkkoa. Anssi kulkee pisteestä \(A\) pisteeseen \(B\) käyttämällä mahdollisimman lyhyttä reitti, jolloin matkan pituus on neljä korttelinväliä. Sellaisissa risteyksissä, joissa kaksi vaihtoehtoa johtaa lyhimpään reittiin, hän valitsee suunnan kolikkoa heittämällä.

  1. Piirrä erilliset kuviot kaikista niistä viidestä mahdollisesta reitistä, joiden pituus on neljä korttelinväliä, ja määritä niiden valintatodennäköisyydet.

  2. Birgitta kulkee pisteestä \(B\) pisteeseen \(A\) ja valitsee mahdollisimman lyhyen reitin vastaavalla tavalla. Anssi ja Birgitta lähtevät liikkeelle samanaikaisesti ja kulkevat samaa vauhtia. Kuinka suurella todennäköisyydellä he kohtaavat toisensa matkan puolivälissä? [S16/8]

Ratkaisu

5.

Koirien kaksipäiväiseen HeinäHaukku-tapahtumaan ilmoittaudutaan joko lauantainäyttelyyn, sunnuntainäyttelyyn tai molempiin.

Eräänä vuonna HeinäHaukkuun ilmoitettiin \(1372\) koiraa, joista \(31\) ilmoitettiin vain lauantainäyttelyyn ja \(43\) vain sunnuntainäyttelyyn. Olkoon \(L\) tapahtuma "HeinäHaukkuun ilmoitettu koira ilmoitettiin lauantainäyttelyyn" ja \(S\) tapahtuma "HeinäHaukkuun ilmoitettu koira ilmoitettiin sunnuntainäyttelyyn".

  1. Laske todennäköisyys \(P(L\text{ ja }S)\) kyseisenä vuonna.

  2. Ovatko \(L\) ja \(S\) riippumattomia kyseisenä vuonna?

  3. Olkoot yleisesti \(a\) vain lauantaille ilmoitettujen koirien lukumäärä, \(b\) kummallekin päivälle ilmoitettujen lukumäärä ja \(c\) vain sunnuntaille ilmoitettujen lukumäärä. Millä lukuja \(a,b,c\) koskevalla ehdolla tapahtumat \(L\) ja \(S\) ovat riippumattomia? [K15/14]

Ratkaisu

6.

Laatikossa on kaksi valkoista ja kolme mustaa palloa. Laatikosta otetaan umpimähkää kaksi palloa. Olkoon satunnaismuuttujan \(X\) nostossa saatujen mustien pallojen lukumäärä. Laske todennäköisyydet \(P(X=k),k=0,1,2\). Määritä odotusarvo \(E(X)\). [S08/8]

Ratkaisu

7.

Monivalintatestissä on \(25\) väitettä ja kussakin kaksi vaihtoehtoa. Opiskelija tietää oikean vastauksen \(10\) väitteeseen, mutta joutuu arvaamaan loput. Millä todennäköisyydellä hän läpäisee testin, kun läpipääsyyn vaaditaan \(15\) oikeaa vastausta? [S10/6]

Ratkaisu

8.

Annin pelaamassa tietokonepelissä on \(90\%\):n todennäköisyys onnistua.

  1. Kuinka suurella todennäköisyydellä neljän pelin sarjassa tulee tarkalleen yksi epäonnistuminen?

  2. Mikä on neljän pelin sarjassa onnistuneiden pelien lukumäärän odotusarvo?

  3. Kuinka monta kertaa Annin täytyy pelata, jotta onnistuneiden pelien lukumäärän odotusarvo olisi vähintään \(10\)? [S15/6]

Ratkaisu

9.

Todennäköisyys, että erään tulppaanilajikkeen sipuli itää, on \(0,7\). Kuinka monta sipulia on vähintään istutettava, jotta niistä ainakin kaksi itäisi yli \(99\%\) todennäköisyydellä? [S00/7]

Ratkaisu

10.

Tiedetään, että eräässä nelilapsisessa perheessä ainakin yksi lapsista on tyttö. Mikä on tällöin todennäköisyys, että kaikki lapset ovat tyttöjä?

Jos tiedetään, että ainakin kaksi lapsista on tyttöjä, mikä on todennäköisyys, että perheessä on kaksi poikaa?

Oletetaan, että poikia ja tyttöjä syntyy yhtä suurella todennäköisyydellä. Millaiset tulokset saadaan, jos käytetäänkin tilastojen antamia todennäköisyyksiä: poikien syntymistodennäköisyys on \(p=0,51\) ja tyttöjen \(t=0,49\)? Sukupuolen määräytymiset oletetaan riippumattomiksi tapahtumiksi. [S06/10]

Ratkaisu

Lähteet

  • Tilasto 1: Suomen virallinen tilasto (SVT): Väestön koulutusrakenne [verkkojulkaisu]. ISSN=1799-4586. 2017. Helsinki: Tilastokeskus [viitattu: 22.7.2019]. Saantitapa: http://www.stat.fi/til/vkour/2017/vkour_2017_2018-11-02_tie_001_fi.html
  • Tilasto 2: Suomen virallinen tilasto (SVT): Koulutukseen hakeutuminen [verkkojulkaisu].ISSN=1799-4500. 2017. Helsinki: Tilastokeskus [viitattu: 22.7.2019]. Saantitapa: http://www.stat.fi/til/khak/2017/khak_2017_2018-12-13_tie_001_fi.html
  • Tilasto 3: SVT: Luonnonvarakeskus, Maatilojen sadonkäyttö.
  • Tilasto NN: Suomen virallinen tilasto (SVT): Rakennukset ja kesämökit [verkkojulkaisu]. ISSN=1798-677X. 2018. Helsinki: Tilastokeskus [viitattu: 29.7.2019]. Saantitapa: http://www.stat.fi/til/rakke/2018/rakke_2018_2019-05-21_tie_001_fi.html

These are the current permissions for this document; please modify if needed. You can always modify these permissions from the manage page.