Student t-toets (groepen)


De Student t-toets is een statistische analyse waarmee de onderzoeker na wil gaan of de gemiddelden van twee (onafhankelijke) groepen van elkaar verschillen.

Terug naar woordenboek onderzoek methodologie en statistiekTerug naar woordenlijst

Voorbeelden van vraagstellingen waarin de Student t-toets gebruikt kan worden, zijn:
- zijn Nederlanders gemiddeld genomen langer dan Fransen?
- verdienen mannen meer dan vrouwen?
- is de aardappeloogst groter op kleigrond dan op zandgrond?

Voorwaarden:
Deze statistische toets wordt uitgevoerd voor een onafhankelijke variabele op nominaal niveau en een afhankelijke variabele op interval / ratio niveau.

Er zijn twee formules voor het bepalen van de toetswaarde:

Formule t-toets (1)

Formule t-toets (2) 

De eerste is de meest gebruikte en heeft nx + ny - 2 vrijheidsgraden. Bij deze formule schuilen nog wel twee addertjes onder het gras. De eerste is dat de groepen als precies even groot worden verondersteld. Indien de afwijking niet te groot is, levert dat geen problemen op. Is dat wel het geval dan moet formule 2 worden gebruikt.
      Het tweede addertje is gevaarlijker: er wordt verondersteld dat de populatievarianties aan elkaar gelijk zijn. Dit hoeft natuurlijk niet waar te zijn en is ook moeilijk hard te maken omdat de populatievarianties meestal niet bekend zijn. In plaats van de populatievariantie is wel de steekproefvariantie bekend. Deze is dan ook te gebruiken als een schatter van de populatievariantie. Of deze varianties van elkaar verschillen kan getoetst worden door middel van een F-toets. Mocht hieruit blijken dat de varianties van elkaar afwijken, dan moet formule 2 worden gebruikt.

De tweede formule lijkt eenvoudiger, maar helaas is hier het aantal vrijheidsgraden veel moeilijker vast te stellen. Deze wordt berekend met de volgende formule:

Formule t-toets vrijheidsgraden

Welke van beide formules is nu de beste? Om hier een antwoord op te geven wordt gekeken naar de verschillen. Dat zijn er twee. De toetswaarden uit beide formules verschillen vaak slechts enkele honderden, maximaal slechts tienden van elkaar. Dit is mede afhankelijk van de groepsgrootte; is die nagenoeg gelijk (oftewel nx = ny) dan verschillen beide waarden niet zo veel van elkaar. Echter hoe meer de groepsgroottes van elkaar afwijken des te beter is het om formule 2 te nemen. Een tweede verschil betreft het aantal vrijheidsgraden. In formule 2 is dat ietsje minder waardoor deze toets als conservatiever - in de zin van minder vlug significante resultaten opleverend - wordt beschouwd. Om deze redenen is het altijd goed om formule 2 te gebruiken. Als aan de voorwaarden van een ongeveer gelijke groepsgrootte wordt voldaan en er verondersteld mag worden dat de varianties in de populaties dezelfde zijn, is het evenwel niet fout om formule 1 te gebruiken. Het voordeel hiervan is, dat het aantal vrijheidsgraden gemakkelijker is te berekenen, hetgeen voor het berekenen met de hand welkom is. Tevens is het aantal vrijheidsgraden in formule 1 altijd een geheel getal, en dat is bij alle andere statistische toetsen ook het geval.

Er zijn computerprogramma’s die beide t-waarden standaard uitrekenen. Het enige wat de onderzoeker dan moet doen is de juiste kiezen. Hij moet dan wel weten welke hij moet kiezen en waarom.

© Foeke van der Zee / BMOOO - Woordenboek onderzoek, methodologie en statistiek

Zie ook:
- statistische methoden
- experimentele en niet-experimentele variabelen
- het niveau van variabelen