Sådan laver du et boksplot i Excel

Skrevet af Kasper Langmann, Microsoft Office Specialist.

Hvis du laver statistisk analyse, vil du måske få brug for at lave et ‘boks plot’ (engelsk: ‘box plot’) for at vise fordelingen af dine data.

Boksplot er oplagt til at sammenligne fordelingen af flere populationer i samme diagram. Det giver ofte et godt og enkelt overlik, med synlige kvartiler og median.

Dette kunne være en oplagt deskriptiv statistik af f.eks. testresultater

Jeg vil nu lære dig at lave et boksplot i Excel – også kaldet ‘kasse med hale’-diagram.

Download øvelsesfilen

Inden du går i gang med resten af guiden, så download øvelsesfilen og følg de trin jeg viser dig.

Download øvelsesfil

Hvad er et boksplot

Et boksplot er et kassediagram, som illustrerer et sæt numeriske værdiers median, kvartiler samt ofte maksimum og minimum.box plot

Et datasæt bliver således opdelt i kvartiler, hvor en boks tegnes mellem det første og tredje kvartil med en yderligere linje trukket langs den anden kvartil som markerer medianen.

Hertil kommer en eventuel markering af minimum og maksimum ud for første og tredje kvartil, som er afbildet med linjer, der ofte kaldes ‘haler’ på dansk.

Sådan laver du et boksplot

I de nyere versioner af Excel er det blevet noget lettere at lave et boksplot end tidligere, hvor du i langt højere grad selv udregne dine data, såsom medianerne, inden disse kunne bruges til at lave et boksplot.

Nu klarer Excel store dele af arbejdet og du kan hurtigt få et boksplot.

Dette skyldes at denne visualisering af data nu kan vælges som diagramtype, med et navn så beskrivende, som et ‘kasse med hale’-diagram.

Trin 1: Vælg dine data

Du skal selvfølgelig have nogle data at lave boksplot af. Dette kan enten være en enkelt dataserie eller flere.

I mit eksempel har jeg tre fiktive klasser og deres gennemsnitskarakterer i forskellige fag.

Eksempel på datasæt til boks plot

Trin 2: Indsæt diagram

Markér de data som du ønsker at lave boksplot af.

(Jeg tager her klassenavnene med i markeringen med det samme, for let at kunne navngive de forskellige boksplots).

Markering af data til boks plot

Du skal nu indsætte den diagramtype som du ønsker. Som nævnt, hedder boks plot ‘Kasse med hale’ blandt diagrammerne.

Du finder ‘Kasse med hale’ under ‘Indsæt statistikdiagram’ i fanen ‘Indsæt’.

Indsæt 'kasse med hale'-diagram

Herefter dukker tre boksplot afbildninger op – et for hver klasse.

Dog uden navnene på dem.

Eksempler på 'kasse med hale'-diagram

Trin 3: Formatér og tilpas diagram

Vi vil gerne kunne se hvilken boksplot, som tilhører hvilken klasse.

Da vi også markerede det da jeg lavede diagrammet, er de ”registreret” – så skal vi nu blot have dem vist.

Vi skal derfor tilføje diagramelementer. Det gør du ved at klikke på ‘+’ ved siden af diagrammet.

Herefter afkrydses ‘Forklaring’ samt din præference omkring, hvor det skal placeres.

Du kan lege lidt med de forskellige elementer og se hvilke muligheder, som du ønsker.

Eksempel på tilføjelse af diagramelementer

Herefter retter du navnet på diagrammet og VOILA!

Eksempel på tre boks plots

Et styks diagram med tre kassediagrammer med haler – med kvartiler (og median) samt et kryds, som viser middelværdien.

Men der sker da noget mystisk i den tredje, hvor der er en prik, frem for en ‘hale’…

(Trin 4: Tjek dine data)

Det giver lidt sig selv hvis man arbejder med statistik, men det er også en visuel pointe i vores eksempel.

Mange vil opleve at der kan forekomme afvigere i data som skal behandles. Disse kan skyldes fejl, men det kan også være rigtig nok. Disse bliver ofte mere synlige når de visualiseres som diagrammer.

Hermed vil potentielle afvigere stikke mere i øjnene og du vil dermed få en bedre chance på både at finde fejl, men også beskrive og analysere dine data.

I mit eksempel med de tre boksplots, mangler den sidste for ‘C KLASSEN’ sin hale, som symboliserer ‘maksimum’. I stedet har den en enkelt prik. I statistikverdenen kaldes disse for ‘outliere’ og synliggør enkeltstående tilfælde.

C-klassen klarer sig generelt ikke så godt som de øvrige. Så i det fag, hvor de faktisk får 7 i gennemsnit, ser Excel som en outlier – denne karakter er ret enkeltstående.

Det er nyttigt til sin analyse, men for nu at føre eksemplet til ende, så prøver vi lige at ændre lidt på C’s data.

Hvis vi nu ændrer en af de øvrige karakterer til 8 hos C klassen, så er der ikke længere tale om et enkeltstående tilfælde, hvorfor boksplottet nu får en ‘maksimum’-hale.

Eksempel på ændring i data - boks plot

Altså skal der nødvendigvis ikke meget til at vores diagram ændres og dermed kan tolkes anderledes.

Sådan!

Du kan nu lave et boksplot i Excel – nemmere end nogensinde!

Du er hermed i stand til at sammenligne resultater på en overskuelig og enkel måde. Af samme grund får du også en god mulighed for at spotte afvigere, såkaldte outliere.

God fornøjelse!