Studie naar slaagkansen
Gegeven is de volgende dataset geslaagd
met informatie over een bevraging bij studenten over hun gestuurde uren en slaagkansen op een examen.
- \(Y\): geslaagd (1 = ja, 0 = nee)
- \(X\): gestudeerd (uren)
We beschikken in deze specifieke steekproef over een totaal van 20 observaties (\(n = 20\)).
de dataset ziet er als volgt uit:
X | Y |
---|---|
0.50 | 0 |
0.75 | 0 |
1.00 | 0 |
1.25 | 0 |
1.50 | 0 |
1.75 | 0 |
1.75 | 1 |
2.00 | 0 |
2.25 | 1 |
2.50 | 0 |
2.75 | 1 |
3.00 | 0 |
3.25 | 1 |
3.50 | 0 |
4.00 | 1 |
4.25 | 1 |
4.50 | 1 |
4.75 | 1 |
5.00 | 1 |
5.50 | 1 |
Als we de relatie visueel willen weergeven tussen het aantal gestudeerde uren en het al dan niet slagen op een examen, krijgen we volgende plot:
Op basis van de geslaagd
dataset krijgen we volgende schatting
\(logit(p) = -4.0777 + 1.5046X\) \(log(odds(p)) = -4.0777 + 1.5046X\)
of \(odds(p) = exp(-4.0777 + 1.5046X)\).
Wanneer we de regressievergelijking invullen krijgen we dus een inschatting van \(odds(p)\).
Interpretatie: Er is geen rechtstreekse interpretatie van de \(\beta\)-coëfficiënten. Wanneer we de exponentiële functie toepassen op de \(\beta\)-coëfficiënten krijgen we wel een bekende interpretatie, namelijk de OR. De \(OR_{gestudeerd} = exp(1.5046) = 4.5\) kunnen we interpreteren als een toename van de odds met \(4.5\) keer wanneer studenten één uur extra studeerden.
Interpretatie: Wanneer we een inschatting willen maken van de odds op slagen voor iemand die 2 uur gestudeerd heeft, vullen we de volledige regressievergelijking in. Deze wordt \(odds(p) = exp(-4.0777 + 1.5046 \times 2) = 0.344\), waarbij de odds op slagen dus 0.344 bedraagt. De odds kunnen opnieuw omgezet worden naar een kans \(p\) door gebruik te maken van volgende formule: \(p = \frac{odds(p)}{odds(p)+1} = \frac{0.344}{0.344+1} = 25.6\%\). De kans op een geslaagd resultaat bedraagt dus 25.6%.
Deze inschatting kunnen we ook als volgt visueel voorstellen: