Anova

De anova is een statistische analyse of een statistische toets die gebruikt wordt voor het vaststellen of de gemiddelden van drie of meer groepen van elkaar verschillen.

Terug naar woordenboek onderzoek methodologie en statistiekTerug naar woordenlijst

Het principe van deze statistische analyse is relatief eenvoudig. Uit de gemeten waarden van een kenmerk berekent men een algemeen gemiddelde; dit wordt aangeduid met de Griekse letter µ. Ook is voor iedere groep een gemiddelde te berekenen; en dit wordt aangeduid als yj. Er kunnen nu drie soorten variantie worden berekend:
 1) de variantie als gevolg van de afwijking van de groepsgemiddelden ten opzichte van het algemene gemiddelde (yj - µ);
 2) de variantie van elke onderzoekeenheid ten opzichte van het groepsgemiddelde ( yij - yj);
 3) de variantie als gevolg van de afwijkingen van de individuele scores ten opzichte van het algemeen gemiddelde ( yij - µ).

Nu is vast te stellen hoeveel procent van de groepsvariantie deel uitmaakt van de totale variantie en hoeveel procent van de individuele variantie binnen de groepen deel uitmaakt van de totale variantie. Oftewel: als de gemiddelden tussen de groepen veel verschillen, dan is er een grote variantie in (yj - µ). En als de gemiddelden tussen de groepen niet zo veel verschillen, dan is de variantie in (yj - µ) nagenoeg nul.
      Er zijn nog wel wat voorwaarden. Men mag varianties niet zondermeer bij elkaar optellen. Daarom gebruikt men slechts een deel van de formule voor het berekenen van de variantie. Dat mag omdat: de individuele score is hetzelfde als het algemeen gemiddelde plus (het groepsgemiddelde minus het algemeen gemiddelde) plus (de individuele score minus het groepsgemiddelde). Ofwel yij = µ + (yj - µ) + ( yij - yj).
      Bij het berekenen van de varianties wordt de sommatie boven de deelstrepen de sum of squares genoemd. Als men de sum of squares deelt door het aantal vrijheidsgraden, krijgt men de mean squares. Een overzicht van de te gebruiken formules staat in het schema hierna:

  Sum of Squares Vrijheids-graden Mean Sqaures

Percentage verklaarde variantie

Groepsscore

Σ nj (yj - µ)2

 j-1

Σ nj (yj - µ)2 /(j-1)

 Σ nj (yj - µ)2  /
      Σ (yij - µ)2
Individuele score Σ (yij - yj)2  n-j

Σ (yij - yj)2 /(n-j)

  Σ (yij - yj)2 /
    Σ (yij - µ)2
Totaal Σ (yij - µ)2  n-1    

Het berekenen van de toets-waarde (de F) is het delen van de mean square van de groepsscore door de mean square van de individuele score (zie formule). Dit is een beetje tegen de verwachting in; zonder nadenken zou men op voorhand kiezen voor het totaal. Er wordt echter getoetst als de eigen variantie gedeeld door het restant van de totale variantie (oftewel het totaal minus de eigen variantie).

In onderstaande illustratie staat een rekenvoorbeeld met een beperkt aantal waarnemingen. Uit deze statistische analyse mag men alleen concluderen dat de vier groepsgemiddelden statistisch significant van elkaar verschillen. Waar dat nou precies in zit, is nog niet duidelijk. Tussen groep 1 en 4 zit het grootste verschil, dus dat zou de oorzaak voor het significante resultaat kunnen zijn, maar misschien is er ook nog een statistisch significant verschil tussen groep 1 en 3, of tussen 1 en 2. Dit moet men door middel van aanvullende analyses (t-toetsen) trachten te achterhalen.

 

    Groep 1     Groep 2     Groep 3     Groep 4     Gemiddelde  

Waarnemingen  

 

 

 

475
500
515
540
540
545
550
575
465
475
485
495
505
515
525
535
425
425
450
450
475
500
525
550
375
400
425
425
450
500
500
525
 
Gemiddelden 530 500  475  450 488,75

 

  Sum of squares Vrijheids-graden    Mean squares F-waarde p-waarde Percentage verklaarde variantie
Groepen 28.150 3 9.383,33 5,69 < .01 38%
Individuele scores 46.200 28 1.650,00     62%
Totaal 74.350 31        

 


© Foeke van der Zee / BMOOO - Woordenboek onderzoek, methodologie en statistiek

Zie ook:
- statistische methoden
- variantie (standaarddeviatie)