SatuWivolin muok siniharmaatausta2
07.02.2022

Virhemarginaali, ja mitä se tarkoittaa?

Melkein aina kun julkisuudessa törmää kyselytutkimuksiin, niin tulosten yhteydessä ilmoitetaan virhemarginaali ja/tai luottamusväli. Mitä ne ovat ja mitä ne käytännössä tarkoittavat?

Virhemarginaali

Tilastotieteessä lasketaan usein virhemarginaali, joka arvioi kuinka todennäköisesti kyselyn tulokset toistettaessa osuvat samaan marginaaliin ja siten ovat lähellä todellista arvoa. Mitä suurempi virhemarginaali, sitä vähemmän tulokset ovat luotettavia ja sitä todennäköisemmin poikkeavat todellisuudesta. Mitä pienempi virhemarginaali, sitä enemmän voit luottaa tuloksiin. Virhemarginaalia voidaan pitää keinona mitata kyselytutkimuksen luotettavuutta.

Koska virhemarginaali riippuu nk. luottamustasosta, on samasta aineistosta saatavissa useita virhemarginaaleja, joten on väärin sanoa esimerkiksi kannatuskyselyssä, että "Tutkimuksen virhemarginaali on 3,5 puoleen tai toiseen." Tutkimuksella ei ole yhtä virhemarginaalia, vaan virhemarginaali liittyy tutkimuksen antamiin numeerisiin arvoihin. Edellä olisi ollut oikeammin sanoa "Tutkimuksessa saadun kannatuksen virhemarginaali on 3,5 puoleen tai toiseen 95 % luottamustasolla."

Virhemarginaali voidaan laskea suoraan otoksen koosta (vastaajien lukumäärä), ja se ilmoitetaan yleensä yhdellä kolmesta luottamusvälin tasosta. 99 % taso on konservatiivisin, 95 % taso on yleisin ja 90 % tasoa käytetään harvoin. 99 % luotettavuustasolla olemme 99 % varmoja siitä, että todellinen arvo on tutkimuksessa saadun arvon virhemarginaalin sisällä.

Usein virhemarginaalin pohjalta muodostetaan luottamusväli.

Luottamusväli

Luottamusväli on arvoväli, jolle todellinen arvo tietyllä todennäköisyydellä sijoittuu. Luottamusvälin alarajan saan vähentämällä tuloksesta virhemarginaali ja ylärajan saan lisäämällä tulokseen virhemarginaali. Näin todennäköisesti todellinen tulos asettuu virhemarginaalin mitan sisään kyselytutkimuksen tulosten ylä- tai alapuolelle. Esim. jos 50 % vastanneista vastasi ”kyllä”, ja virhemarginaali on 5 %, tämä tarkoittaa, että 45–55 % väestöstä ajattelee, että vastaus on ”kyllä” (50 % +/- 5 %).

Tärkeää!

Virhemarginaalin arvo on luotettava ainoastaan, jos otos on valittu perusjoukosta asianmukaista otantamenetelmää käyttäen. Katso blogi otantamenetelmistä.

 

Miten virhemarginaali lasketaan?

Kaava:            Kaava      

Esimerkki, jos 95% luottamustaso: 1,96*1,1/√800 = 7,6 %, eli jos tulos olisi 50% oli "kyllä" mieltä, niin todellinen vastaus sijoittuu 42% ja 58% väliin. Ei kovin hyvä tulos - esimerkin keskihajonta on liian suuri.

Z - Z pisteytys

S - populaation keskihajonta

n - otoskoko

Löytääksesi z-pistemäärän, sinun on päätettävä luottamusväli, koska Z-pistemäärä riippuu siitä. Alla oleva taulukko antaa nähdä luottamusvälin ja z-pisteet:

 

 

Luottamusväli Z - pisteet  
80% 1,28  
85% 1,44  
90% 1,65  
95% 1,96 käytetyin
99% 2,58  

 

Virhemarginaali auttaa meitä ymmärtämään, onko kyselyn otoskoko sopiva vai ei. Jos virhemarginaali on liian suuri, ehkä otoskoko on liian pieni ja meidän on lisättävä sitä niin, että otoksen tulokset vastaavat paremmin populaatiotuloksia.

Joissakin tilanteissa virhemarginaalista ei ole paljon hyötyä eikä se auta meitä virheen jäljittämisessä

  • Jos kyselyn kysymyksiä ei ole suunniteltu niin, että ne ovat selkeitä ja yksiselitteisiä ja mittaavat sitä mitä niiden pitääkin mitata
  • Jos kyselyn vastaaja ei tunne aihealuetta, ei halua tai jaksa vastata rehellisesti tai vastaa kuten hän olettaa, että pitäisi vastata, niin tulos ei ole kovin tarkka
  • Jos valittu otos ei edusta väestöä oikein (otantavirhe)

Lisäksi yksi iso oletus on, että väestö on normaalisti jakautunut. Joten jos otoksen koko on liian pieni ja populaation jakauma ei ole normaalia, z-pistettä ei voida laskea eikä emme löydä virherajaa.

Yhteenveto

Aina kun tutkimme kyselytutkimuksen avulla asioita ja ilmiöitä, on jonkin verran epävarmuutta ja mahdollisuuksia, että tulos saattaa poiketa todellisesta tuloksesta. Virhemarginaali kertoo meille poikkeamaan suuruuden ja tulosten luotettavuuden. Meidän on yritettävä minimoida virhemarginaalia, jotta tulokset kuvaavat todellista tilannetta. Mitä enemmän voimme kaventaa virheen vaihteluväliä, sitä paremmat ovat tulokset. Virhemarginaali täydentää tietämystämme tulosten yleistettävyydestä ja siten luotettavuudesta. Mutta kuten huomasimme, aina ei ole mahdollista laskea virhemarginaalia, vaan luotettavuutta pitää arvioida muilla keinoilla.