Mål for spredning i statistik og stikprøver

4 minutter

Mål for spredning i statistik er afgørende for aflæsningen af ethvert datasæt, da de viser dig, hvor varierende dine data er.

Mål for spredning i statistik og stikprøver

Sidste ændring: 25 september, 2019

Mål for spredning i statistik er væsentligt, da det viser dig variationerne i en bestemt stikprøve eller gruppe af mennesker. Når det handler om stikprøver er spredningen vigtig, fordi den afgør hvilken usikkerhed, du har, når du laver konklusioner om centrale tendenser, for eksempel gennemsnit.

Spredning spiller en stor rolle i ethvert datasæt. Disse målinger hænger sammen med målinger af centrale tendenser og viser dig variansen i dine data.

Målinger af centrale tendenser viser dig de forskellige måder, du kan inddele dine data på. De er gode, når du vil se, hvordan de forskellige variabler fungerer i en bestemt stikprøve eller gruppe af mennesker. De tre grundlæggende ting, de kan vise dig, er medianen, middelværdien og værdimængden.

Mål for spredning går hånd i hånd med mål for centrale tendenser. De er også afgørende for aflæsningen af ethvert datasæt, da de viser dig, hvor varierende dine data er. Deres vigtige rolle inden for statistik er blev betonet af Wild og Pfannkuch (1999).

Ifølge forfatterne er vores opfattelse af variansen i data en af de grundlæggende elementer i statistisk tænkning. Måden, hvorpå vi opfatter variansen, giver os informationer om spredningen, med hensyn til middelværdien eller medianen.

Middelværdi, eller gennemsnit, er meget udbredt i statistik. Men det kan nemt fejlfortolkes. Det sker især, når der er en stor spredning i værdierne i variablen. Det er her, at mål for spredning i statistik kommer ind i billedet.

Der findes 3 vigtige elementer i mål for spredning, som er relateret til tilfældighedsvariabler (2):

Opfattelsen af, hvor almindelige de er i verden omkring dig.
Om der er forskellige forklaringer.
Evnen til at kvantificere dem (hvilket betyder at forstå meningen med spredning og vide, hvordan det bruges).

Hvad bruges spredning i statistik til?

Mål for spredning er vigtigt i enhver statistisk undersøgelse, når du vil forsøge at drage konklusioner ud fra dine data. Det skyldes, at det spiller en direkte rolle for den usikkerhed, du arbejder med. Jo større spredning der er i en stikprøve, jo mere plads har du brug for, til at arbejde inden for den margin.

De kan også hjælpe dig til at fastslå, om dine data ligge langt fra den centrale tendens. Dette viser dig, hvovidt din centrale tendens rent faktisk er en god måde at repræsentere de mennesker, du har udvalgt til din undersøgelse. Det er meget nyttigt, når det drejer sig om at sammenligne fordelinger og forstå de risici, der er ved at træffe bestemte beslutninger (1).

Kort sagt: Jo større spredning, jo mindre repræsentativ er din centrale tendens. De her er de mest almindelige mål for spredning i statistik:

Værdimængde
Gennemsnitlig afvigelse
Varians
Standardafvigelse
Varianskoefficient

Sådan fungerer de hver især

Værdimængde for spredning i statistik

Værdimængden er generelt bedst, når du skal lave dine første sammenligninger, fordi den kun beskæftiger sig med de to yderpoler i dine data. Det er også grunden til, at den generelt kun kan betale sig at måle i mindre stikprøver (1). Den basale definition af værdimængden er: Forskellen mellem de første og sidste data.

Halve og hele æbler symboliserer statistik

Gennemsnitlig afvigelse

Så er der den gennemsnitlige afvigelse. Dette mål er nyttigt, da det fortæller dig, hvor dine data ville placere sig, hvis de alle havde præcis den samme afstand fra middelværdien (1).

Et tals afvigelse fra variablen, er forskellen mellem variablens absolutte værdi og middelværdien. Således er den gennemsnitlige afvigelse sådan set bare gennemsnittet af alle afvigelserne (3).

Varians ved spredning i statistik

Varians er en matematisk funktion for alle værdierne, og den er perfekt til inferentiel statistik (1). Variansen er simpelthen kvadrattallet af alle afvigelserne.

Standardafvigelse

Standardafvigelse er det mest almindelige mål for spredning, for enhver stikprøve taget fra den samme gruppe af mennesker (1). Det er kvadratroden af variansen.

Varianskoefficient

Dette mål bruges primært til at sammenligne variationen mellem to sæt af data, delt i to separate grupper. For eksempel hvis du skal have information om højden og vægten på de studerende på en skole.

Det kan hjælpe dig med at udregne hvilken bestemt fordeling, der viser den største gruppering af dine data, og på den måde opnå en mere repræsentativ måling.

Person ser på spredning i statistik på tablet

Varianskoeffecienten er den mest repræsentative af alle de mål for spredning i statistik, vi har nævnt, fordi det giver dig et rent tal. Med andre ord, så er det uafhængigt at variablerne i dine grupper. Generelt vil du se varianskoefficienten vist som en procentdel (3).

Disse mål for spredning er måder, hvorpå du kan se, hvor meget variabilitet der er i din stikprøve. De viser også, hvor repræsentativt din centrale tendens er. Hvis variabiliteten er lav, så betyder det, at dine data er relativt tæt på tendensen, og en god gengivelse af det overordnede datasæt.

På den anden side, hvis du har en høj variabilitet, så betyder det, at dine data er spredt ud, snarere end koncentreret. Høj variabilitet angiver, at den centrale tendens ikke er særligt repræsentativ. Hvis dette er tilfældet, skal du have fat i en større mængde data. Flere data vil reducere variabiliteten, som var hovedårsagen til din store usikkerhed eller fejlmargin.