Keskiluvut, hajontaluvut ja virheen eteneminen

Tämän sivun tuloksista on hyötyä eritysesti laboratoriotöiden yhteydessä.

Keskiluvut

Tilastollisia tunnuslukuja, kuten keskilukuja hyödynnetään tiivistämään tilastollista tietoa. Esimerkiksi laboratoriotyössä kahdestakymmenestä eri mittauksesta on vaikeaa sanoa mitään lyhyellä tarkastelulla, mutta tunnusluvut helpottavat olennaisen informaation keräämistä. Tunnetuimpia keskilukuja ovat keskiarvo, aineiston yleisin arvo eli moodi sekä suuruusjärjestykseen järjestetyn aineston keskimmäinen arvo eli mediaani.

Luvuille nämä keskiluvut määritellään seuraavasti:

# keskiarvo

Keskiarvo:

Lukujen keskiarvo on

Huomaa, että, jos lukujen virheet eivät ole yhtä suuria, niistä ei kannata laskea keskiarvoa, vaan painotettu keskiarvo. Keskiarvon virhe eli keskivirhe on missä keskihajonta on


# painotettukeskiarvo

Painotettu keskiarvo:

Lukujen joiden virheet ovat painotettu keskiarvo on

Painotetun keskiarvon virhe on

Mutta miksi?

Painotettua keskiarvoa on mielekästä käyttää, kun esimerkiksi laboratoriossa suoritamme mittauksia siten, että mittausasetelma muuttuu mittausten välillä jolloin emme voi olettaa virheen olevan yhtä suuri kaikissa mittauksissa. Tällöin painotettu keskiarvo antaa enemmän "painoa" tuloksille joilla on pieni virhe. Esimerkiksi linssien polttopistettä mitattaessa painotetun keskiarvon käyttö on suositeltavaa mittaustuloksia analysoidessa.

# moodijamediaani

Moodi: Moodi on se luku tai ne luvut, joita aineistossa esiintyy eniten.

Mediaani: Mediaani on suuruusjärjestyksessä keskimmäinen luku (tai kahden keskimmäisen luvun keskiarvo jos havaintoaineistoa on parillinen määrä).

Eri keskilukujen käyttämisestä mielekästä tekee se, että ne kuvaavat eri asioita aineistosta. Keskiluvun valintaan vaikuttaa aineisto ja se mitä tietoa haluamme siitä esille tuoda. Esimerkiksi, jos mittauksissa ilmenee muutoksia suurilla arvoilla, niin se vaikuttaa muutokseen keskiarvossa, mutta ei mediaanissa.

Esimerkki painotetusta keskiarvosta

Hajontaluvut

Havainnollistus hajontaluvuista

Hajontaluvut ovat yhteydessä tarkastelussa käytettävään keskilukuun ja ne kertovat keskiluvun epävarmuudesta. Jos hajontaluku on suuri eli mittauksen tulokset eivät ole keskittyneet kovinkaan tarkasti keskiluvun ympärille, niin silloin mittaukset eivät ole olleet kovin tarkkoja tai sitten mittauksia on vielä liian vähän.

Hajontalukuja ovat esimerkiksi keskiarvon virhe eli keskivirhe, joka on missä ja painotetun keskiarvon virhe

Muita keskeisiä keskilukuja ja hajontalukuja esitellään satunnaismuuttujien jakaumien osiossa. Yleisesti jakaumien avulla keskilukuina toimii niiden odotusarvo ja hajontalukuna toimii keskihajonta.

Virheen eteneminen

Yleisesti mittaustulosten voidaan olettaa noudattavan jotakin jatkuvaa rajajakaumaa, jolla on jokin tiheysfunktio Todellisuudessa rajajakaumaa ei voida selvittää, mutta mittaustulosten määrän kasvaessa tulokset lähestyvät rajajakaumaa. Saatujen mittaustulosten voidaan siis ajatella olevan otoksia rajajakaumasta.

Satunnainen ja systemaattinen virhe

Mittaustuloksen virhe koostuu systemaattisesta virheestä ja satunnaisvirheestä. Systemaattinen virhe pysyy samana (esimerkiksi mittaajan reaktioaika mitattaessa aikaa sekuntikellolla) tai muuttuu säännönmukaisesti (esimerkiksi mittauslaitteen kalibraatio voi muuttua laitteen lämpenemisen takia tai muusta syystä). Satunnaisvirhe aiheutuu useista toisistaan mahdollisesti riippumattomista tekijöistä ja on usein normaalijakautunut. Jos mittaustulosten jakauma ei ole symmetrinen, on syytä epäillä, että kyseessä ei ole normaalijakauma tai virheet eivät satunnaisia.

Virheet voidaan yhdistää minimi-maksimi -virhearviota käyttäen tai, jos mittaustulosten virheet ovat satunnaisia ja riippumattomia, virheet voidaan yhdistää neliöllisesti. Neliöllisesti yhdistämällä saadaan maksimivirheen sijasta normaalijakaumaan perustuva todennäköinen virhe ja sitä kannattaakin käyttää minimi-maksi -virhearvion sijasta, mikäli mahdollista.

Virheen eteneminen peruslaskutoimituksissa

Minimi-maksimi -virhearviota käyttäen:

Kun saadut mittaustulokset ovat muotoa ... , ja niin minimi-maksimi -virhearviota muotoa olevan lausekkeen virheelle on Vastaavasti vain jakolaskuja ja kertolaskuja sisältän lausekkeen minimi-maksimi -virhearviota käyttäen laskettu virhe on

Neliöllisesti yhdistäen:

Neliöllisesti yhdistämällä aiemmin määritellyn :n virheeksi saadaan ja vastaava yleistys voidaan tehdä myös aiemmin määritellylle :lle, jolloin

Esimerkki

Virheen yleinen etenemislaki

Ainoastaan minimi-maksimi -virhearviota voidaan soveltaa myös monimutkaisempiin funktioihin ottamalla huomioon kaikkien alkuarvojen virheet suuntiin, jotka tuottavat suurimman virheen. Jos kaikkien muuttujien virheet ovat riippumattomia ja satunnaisia, on kuitenkin parempi käyttää virheen yleistä etenemislakia: kun on :n muuttujan funktio, niin sen virhe on missä on funktion osittaisderivaatta muuttujan suhteen.

Esimerkki yhden muuttujan funktion virheestä

Esimerkki kahden muuttujan funktion virheestä

Esimerkki sähkövirran virheen laskemisesta

# kovarianssi

Kovarianssi

Esimerkki kovarianssista

PNS-suoran sovitus

Katso myös matikkapakin ulkopuolella oleva Python fysiikassa -sivuston materiaali. Linkissä tehdään sama suoran sovitus kuin alla olevassa koodissa, mutta parametreja ei lasketa käsin ja sovitettavaa funktiota on helpompi vaihtaa. Toisaalta alla olevasta koodista käy ehkä paremmin ilmi miten sovituksen parametrit oikeastaan lasketaan.

Python-koodi PNS-suoran sovitukseen

These are the current permissions for this document; please modify if needed. You can always modify these permissions from the manage page.