SPSS en oefeningen

In dit deel kunnen jullie voor het eerst kennis maken met lineaire regressie binnen het statistisch softwareprogramma SPSS. Probeer op een gestructureerde manier alle stappen in dit document te volgen en hierna ook de vragen te beantwoorden.

Als kinesitherapeut binnen een obesitaskliniek wil je het verband tussen het BMI (kg/m²) van de patiënten en de uitkomst van de 6-minuten wandeltest (6MWT) in kaart brengen. Gegeven is de volgende dataset:

Table 3.8: Overzicht van data binnen obesitaskliniek
BMI (kg/m2) 6MWT (meter)
23 120
28 108
26 105
22 115
31 95
26 95
32 82
36 87
42 40

Exercise 3.2 Bereken de SST voor uitkomst van de 6MWT. Vergeet niet dat de SST berekend wordt door enkel rekening te houden met het gemiddelde.

Exercise 3.3 Het verband tussen de 6MWT en het BMI wordt weergegeven aan de hand van volgende formule: \(Y = 195.5 – 3.4X\) OF: \(6MWT = 195.5 – 3.4 \times BMI\) Kan je voorspellen wat de uitkomst op de 6MWT zou zijn voor een person met een BMI van 30?

Exercise 3.4 Bereken nu de SSE voor de uitkomst van de 6MWT op basis van bovenstaand regressie-model. Kan je ook de determinatiecoëfficiënt (\(R^2\)) berekenen?

Open SPSS en voeg de data in die in de les gebruikt werd voor het beschrijven van het verband tussen de tevredenheid van kinesitherapeuten over hun honoraria en hun leeftijd. Uiteindelijk zou je volgende dataset moeten hebben ingegeven:

Data voor tevredenheid

Figure 3.4: Data voor tevredenheid

Ga naar analyze > regression > linear en vul daar volgende gegevens aan:

Model invullen

Figure 3.5: Model invullen

Let er op dat we tevredenheid onder dependent (afhankelijk) plaatsen en leeftijd onder independent (onafhankelijke). Klik hierna op Statistics... en selecteer onder de statistieken “confidence intervals”. Klik hierna op Paste en voer de Syntax uit.

Exercise 3.5 Kan je in de output het regressiemodel terugvinden?

Exercise 3.6 Is er een significant verband tussen de leeftijd en de score voor tevredenheid? Waaruit leid je dit af?

Exercise 3.7 Waarvoor staat het 95% CI? Kan je dit interpreteren?

Open SPSS en voeg de data in die in de les gebruikt werd in oefening 1. Uiteindelijk zou je volgende dataset moeten hebben ingegeven:

Data voor obesitas

Figure 3.6: Data voor obesitas

Ga naar analyze > regression > linear en vul daar volgende gegevens aan:

Model invullen obesaitas

Figure 3.7: Model invullen obesaitas

Klik hierna op Statistics... en selecteer onder de statistieken “confidence intervals”. Klik hierna op Paste en voer de Syntax uit.

Exercise 3.8 Kan je in de output de fouten terugvinden die het model maakt (SSE en SST)? Wat is de waarde van de SSE?

Exercise 3.9 Is er een significant verband tussen de BMI en de 6MWT? Wat is de p-waarde voor deze associatie?

Exercise 3.10 Waarvoor staat het 95% CI? Kan je dit interpreteren?

Probeer ook nog even volgende meerkeuzevragen te beantwoorden:

Exercise 3.11 Ik heb een categorische variabele over het opleidingsniveau welke bestaat uit 5 mogelijke antwoorden. Selecteer het correcte antwoord.

  • Ik kan deze variabele zo toevoegen in het lineaire model in SPSS.
  • Ik zal deze moeten hercoderen naar 5 nieuwe variabelen.
  • Ik zal deze moeten hercoderen naar 4 nieuwe variabelen.
  • Ik zal deze moete hercoderen naar een continue variabele met schaal 1 t.e.m. 5.

Exercise 3.12 Als ik een lineair model maak in SPSS, dan…

  • Is het belangrijk dat ik steeds de lineariteit, multicollineariteit en normaalverdeling van de residuen bekijk.
  • Dien ik eerst te kijken naar de VIF om multicollineariteit na te gaan.
  • Dien ik gebruik te maken van een spearman correlatiecoeffiënt om lineariteit na te gaan.

Exercise 3.13 Wanneer je verschillende onafhankelijke variabelen hebt, is het vaak moeilijk om een finel model te selecteren. Op basis van jouw opgedane kennis, hoe denk je dat het finaal model het best geselecteerd wordt? Op basis van…

  • De klinische relevantie.
  • Een automatische methode voor variabelen selectie.
  • Het veranderen van \(R^2\), hoe hoger deze wordt hoe beter mijn model.
  • De significantie van de variabelen in mijn model.

Je maakt een lineair regressiemodel met extensiekracht ter hoogte van de knie als afhankelijke variabele en leeftijd, lage rugpijn, geslacht en fysieke fitheid als onafhankelijke variabelen. Gegeven is volgende onvolledige ANOVA-tabel. Probeer deze zo goed mogelijk aan te vullen (de zwarte vakken dienen niet te worden aangevuld).

Invullen ANOVA tabel

Figure 3.8: Invullen ANOVA tabel