Studie naar slaagkansen

Gegeven is de volgende dataset geslaagd met informatie over een bevraging bij studenten over hun gestuurde uren en slaagkansen op een examen.

  • \(Y\): geslaagd (1 = ja, 0 = nee)
  • \(X\): gestudeerd (uren)

We beschikken in deze specifieke steekproef over een totaal van 20 observaties (\(n = 20\)).

de dataset ziet er als volgt uit:

Table 4.5: Steekproef naar studeergedrag.
X Y
0.50 0
0.75 0
1.00 0
1.25 0
1.50 0
1.75 0
1.75 1
2.00 0
2.25 1
2.50 0
2.75 1
3.00 0
3.25 1
3.50 0
4.00 1
4.25 1
4.50 1
4.75 1
5.00 1
5.50 1

Als we de relatie visueel willen weergeven tussen het aantal gestudeerde uren en het al dan niet slagen op een examen, krijgen we volgende plot:

Op basis van de geslaagd dataset krijgen we volgende schatting

\(logit(p) = -4.0777 + 1.5046X\) \(log(odds(p)) = -4.0777 + 1.5046X\)

of \(odds(p) = exp(-4.0777 + 1.5046X)\).

Wanneer we de regressievergelijking invullen krijgen we dus een inschatting van \(odds(p)\).

Interpretatie: Er is geen rechtstreekse interpretatie van de \(\beta\)-coëfficiënten. Wanneer we de exponentiële functie toepassen op de \(\beta\)-coëfficiënten krijgen we wel een bekende interpretatie, namelijk de OR. De \(OR_{gestudeerd} = exp(1.5046) = 4.5\) kunnen we interpreteren als een toename van de odds met \(4.5\) keer wanneer studenten één uur extra studeerden.

Interpretatie: Wanneer we een inschatting willen maken van de odds op slagen voor iemand die 2 uur gestudeerd heeft, vullen we de volledige regressievergelijking in. Deze wordt \(odds(p) = exp(-4.0777 + 1.5046 \times 2) = 0.344\), waarbij de odds op slagen dus 0.344 bedraagt. De odds kunnen opnieuw omgezet worden naar een kans \(p\) door gebruik te maken van volgende formule: \(p = \frac{odds(p)}{odds(p)+1} = \frac{0.344}{0.344+1} = 25.6\%\). De kans op een geslaagd resultaat bedraagt dus 25.6%.

Deze inschatting kunnen we ook als volgt visueel voorstellen: