Keskiluvut, hajontaluvut ja virheen eteneminen
Tämän sivun tuloksista on hyötyä eritysesti laboratoriotöiden yhteydessä.
Keskiluvut
Tilastollisia tunnuslukuja, kuten keskilukuja hyödynnetään tiivistämään tilastollista tietoa. Esimerkiksi laboratoriotyössä kahdestakymmenestä eri mittauksesta on vaikeaa sanoa mitään lyhyellä tarkastelulla, mutta tunnusluvut helpottavat olennaisen informaation keräämistä. Tunnetuimpia keskilukuja ovat keskiarvo, aineiston yleisin arvo eli moodi sekä suuruusjärjestykseen järjestetyn aineston keskimmäinen arvo eli mediaani.
Luvuille nämä keskiluvut määritellään seuraavasti:
Keskiarvo:
Lukujen keskiarvo on
Huomaa, että, jos lukujen virheet eivät ole yhtä suuria, niistä ei kannata laskea keskiarvoa, vaan painotettu keskiarvo. Keskiarvon virhe eli keskivirhe on missä keskihajonta on
Painotettu keskiarvo:
Lukujen joiden virheet ovat painotettu keskiarvo on
Painotetun keskiarvon virhe on
Tästä voit katsoa miten keskiarvon, keskihajonnan ja painotetun keskiarvon kaavat johdetaan käyttäen normaalijakaumaa. Painotetun keskiarvon virhe voidaan johtaa virheen yleisestä etenemislaista: Painottamattoman keskiarvon virhe saadaan painotetun keskiarvon virheestä valitsemalla jolloin
Painotettua keskiarvoa on mielekästä käyttää, kun esimerkiksi laboratoriossa suoritamme mittauksia siten, että mittausasetelma muuttuu mittausten välillä jolloin emme voi olettaa virheen olevan yhtä suuri kaikissa mittauksissa. Tällöin painotettu keskiarvo antaa enemmän "painoa" tuloksille joilla on pieni virhe. Esimerkiksi linssien polttopistettä mitattaessa painotetun keskiarvon käyttö on suositeltavaa mittaustuloksia analysoidessa.
Moodi: Moodi on se luku tai ne luvut, joita aineistossa esiintyy eniten.
Mediaani: Mediaani on suuruusjärjestyksessä keskimmäinen luku (tai kahden keskimmäisen luvun keskiarvo jos havaintoaineistoa on parillinen määrä).
Eri keskilukujen käyttämisestä mielekästä tekee se, että ne kuvaavat eri asioita aineistosta. Keskiluvun valintaan vaikuttaa aineisto ja se mitä tietoa haluamme siitä esille tuoda. Esimerkiksi, jos mittauksissa ilmenee muutoksia suurilla arvoilla, niin se vaikuttaa muutokseen keskiarvossa, mutta ei mediaanissa.
Olemme mitanneet oppilaslaboratoriossa suureelle seuraavat tulokset:
Koska tuloksien virheet poikkeavat toisistaan, on syytä selvittää suureen tulos laskemalla painotettu keskiarvo:
Lasketaan vielä painotetun keskiarvon virhe:
Tällöin suureen X painotettu keskiarvo on
Hajontaluvut
Ohessa on kaksi eri taulukkoa kokeen arvosanoista, joissa on samat keskiarvot, moodit ja mediaanit. Lisäksi niiden vaihteluväli, eli väli pienimmästä arvosta suurimpaan, on sama.
Molemmissa ryhmissä siis keskiarvo, moodi ja mediaani ovat 7. Tarkastellaan graafisesti miten nämä taulukot eroavat toisistaan.
Kuten kuvasta huomataan, ryhmän 1 arvosanat ovat keskittyneempiä keskilukujen ympärille. Ryhmässä 2 taas esiintyy enemmän ääripäissä olevia arvosanoja. Tällaisissa tilanteissa hajontaluvut auttavat selkeyttämään eroa tilastojen välillä. Ne kuvaavat kuinka "hajallaan" aineiston arvot ovat keskenään.
Lasketaan molempien ryhmien keskivirheet:
Kuten huomataan, ryhmän 2 keskivirhe on suurempi joten silloin arvot poikkeavat keskimääräisesti enemmän keskiarvosta, mitä ryhmän 1 tapauksessa.
Hajontaluvut ovat yhteydessä tarkastelussa käytettävään keskilukuun ja ne kertovat keskiluvun epävarmuudesta. Jos hajontaluku on suuri eli mittauksen tulokset eivät ole keskittyneet kovinkaan tarkasti keskiluvun ympärille, niin silloin mittaukset eivät ole olleet kovin tarkkoja tai sitten mittauksia on vielä liian vähän.
Hajontalukuja ovat esimerkiksi keskiarvon virhe eli keskivirhe, joka on missä ja painotetun keskiarvon virhe
Muita keskeisiä keskilukuja ja hajontalukuja esitellään satunnaismuuttujien jakaumien osiossa. Yleisesti jakaumien avulla keskilukuina toimii niiden odotusarvo ja hajontalukuna toimii keskihajonta.
Virheen eteneminen
Yleisesti mittaustulosten voidaan olettaa noudattavan jotakin jatkuvaa rajajakaumaa, jolla on jokin tiheysfunktio Todellisuudessa rajajakaumaa ei voida selvittää, mutta mittaustulosten määrän kasvaessa tulokset lähestyvät rajajakaumaa. Saatujen mittaustulosten voidaan siis ajatella olevan otoksia rajajakaumasta.
Satunnainen ja systemaattinen virhe
Mittaustuloksen virhe koostuu systemaattisesta virheestä ja satunnaisvirheestä. Systemaattinen virhe pysyy samana (esimerkiksi mittaajan reaktioaika mitattaessa aikaa sekuntikellolla) tai muuttuu säännönmukaisesti (esimerkiksi mittauslaitteen kalibraatio voi muuttua laitteen lämpenemisen takia tai muusta syystä). Satunnaisvirhe aiheutuu useista toisistaan mahdollisesti riippumattomista tekijöistä ja on usein normaalijakautunut. Jos mittaustulosten jakauma ei ole symmetrinen, on syytä epäillä, että kyseessä ei ole normaalijakauma tai virheet eivät satunnaisia.
Virheet voidaan yhdistää minimi-maksimi -virhearviota käyttäen tai, jos mittaustulosten virheet ovat satunnaisia ja riippumattomia, virheet voidaan yhdistää neliöllisesti. Neliöllisesti yhdistämällä saadaan maksimivirheen sijasta normaalijakaumaan perustuva todennäköinen virhe ja sitä kannattaakin käyttää minimi-maksi -virhearvion sijasta, mikäli mahdollista.
Virheen eteneminen peruslaskutoimituksissa
Minimi-maksimi -virhearviota käyttäen:
Kun saadut mittaustulokset ovat muotoa ... , ja niin minimi-maksimi -virhearviota muotoa olevan lausekkeen virheelle on Vastaavasti vain jakolaskuja ja kertolaskuja sisältän lausekkeen minimi-maksimi -virhearviota käyttäen laskettu virhe on
Neliöllisesti yhdistäen:
Neliöllisesti yhdistämällä aiemmin määritellyn :n virheeksi saadaan ja vastaava yleistys voidaan tehdä myös aiemmin määritellylle :lle, jolloin
Kun ja niin minimi-maksimi -keinolla :n virheeksi saadaan mutta neliöllisesti yhdistämällä saatava virhe on vain
Kun ja niin Minimi-maksimi -keinolla :n virheeksi saadaan ja neliöllisesti yhdistämällä saatava :n virhe on
Nyt lausekkeen virhe minimi-maksimi -keinoa käyttäen on ja neliöllisesti yhdistäen
Virheen yleinen etenemislaki
Ainoastaan minimi-maksimi -virhearviota voidaan soveltaa myös monimutkaisempiin funktioihin ottamalla huomioon kaikkien alkuarvojen virheet suuntiin, jotka tuottavat suurimman virheen. Jos kaikkien muuttujien virheet ovat riippumattomia ja satunnaisia, on kuitenkin parempi käyttää virheen yleistä etenemislakia: kun on :n muuttujan funktio, niin sen virhe on missä on funktion osittaisderivaatta muuttujan suhteen.
Kun ympyrän säde on (105)mm, niin sen pinta-alan virhe on Itse asiassa samaan tulokseen päästään myös soveltamalla kerto- ja jakolaskuja sisältävän funktion virheelle neliöllisen yhdistämisen yleistyksestä saatua yhtälöä: Neliöllisen yhdistämisen yleistyksenä saatavat peruslaskutoimituksia sisältävien funktioiden virheiden kaavat ovatkin eräitä virheen yleisen etenemislain erikoistapauksia.
Olkoon ja ja Nyt
Kytketään varattu kondensaattori sarjaan vastuksen kanssa. Piirissä kulkeva virta pienenee eksponentiaalisesti noudattaen yhtälöä missä on kapasitanssi, on resistanssi ja kulunut aika. Lasketaan virta virheineen, kun ja
Sijoittamalla arvot yhtälöön saadaan virran arvo: Koska mitattavat suureet ovat toisistaan riippumattomia, on perusteltavaa soveltaa virheen yleistä etenemislakia virheen laskemiseen.
Lasketaan ensin osittaisderivaatat: ja
Sijoitetaan osittaisderivaatat ja virheet saadaksemme virran suuruuden.
Tällöin siis virran arvo virheineen on:
(Huom: suureen virheen arvo sijoitetaan sille kuuluvalle paikalle, esimerkiksi )
Kahden muuttujan ja välistä riippuvuutta voidaan tutkia kovarianssin avulla. Kun kummankin muuttujan arvo on mitattu kertaa ja on i. mittaustulos, :n ja :n välinen kovarianssi on Mikäli muuttujien välinen kovarianssi ei ole nolla eli ne eivät ole riippumattomia, virheen yleiseen etenemislakiin on lisättävä kovarianssitermi. Tällöin
Selvitetään vastuksen resistanssi mittaamalla virtaa ja jännitettä. Oheinen taulukko esittää mitattuja virran ja jännitteen arvoja.
Tällöin virran keskiarvo on ja keskivirhe on Jännitteelle keskiarvo on ja keskivirhe on
Tällöin resistanssin arvo on:
Tarkastetaan virhelaskuja varten ovatko mitattavat suureet riippumattomia:
Koska kovarianssi ei ole nolla, meidän täytyy lisätä kovarianssitermi virheen yleiseen etenemislakiin. Lasketaan osittaisderivaatat:
ja
Tällöin virheen arvo resistanssille on:
Tällöin resistanssin arvo virheineen on
PNS-suoran sovitus
Katso myös matikkapakin ulkopuolella oleva Python fysiikassa -sivuston materiaali. Linkissä tehdään sama suoran sovitus kuin alla olevassa koodissa, mutta parametreja ei lasketa käsin ja sovitettavaa funktiota on helpompi vaihtaa. Toisaalta alla olevasta koodista käy ehkä paremmin ilmi miten sovituksen parametrit oikeastaan lasketaan.
These are the current permissions for this document; please modify if needed. You can always modify these permissions from the manage page.