Chapter 6 Voorbeeldexamen

Om dit voorbeeld examen te kunnen maken dien je te beschikken over een SPSS (.sav) dataset. Om deze dataset te downloaden kan je op volgende knop duwen:

Inleiding

Dit voorbeeldexamen geeft een reële indruk van de verwachtingen op het examen met betrekking tot jullie kennis en vaardigheden binnen SPSS. Aan de hand van deze vragen, zouden jullie in staat moeten zijn om alle vragen binnen dit voorbeeld examen op te lossen. Zoals jullie zien, zal het examen bestaan uit drie delen: (1) een praktisch deel waar jullie aan de slag kunnen gaan met SPSS en (2) een praktisch deel met fragmenten uit een artikel dat jullie dienen te interpreteren en (3) een laatste deel met enkele korte theoretische vragen over de geziene stof. Als alles goed gaat, zouden jullie in staat moeten zijn om dit voorbeeld examen binnen het uur op te lossen.

DEEL I

Neem de dataset SPSS_DATA_REVAKI.sav (die je hierboven kan downloaden) en open deze in SPSS. Probeer hierna alle vragen op een correcte manier te beantwoorden. Alle info over deze dataset vinden jullie binnen het variable-frame van SPSS.

Maak een lineair regressiemodel waarbij de afhankelijke variabelen de CRP-waarden in het bloed is en de onafhankelijke variabelen diabetes (REF = geen diabetes), leeftijd (jaren) en geslacht (REF = man). Beantwoordt hierna volgende vragen. Voor alle duidelijkheid, de referentiecategorie (REF) is de categorie die geassocieerd moet worden met waarde 0.

Exercise 6.1 Selecteer de meest gepaste R² van het model en schrijf deze neer.

Exercise 6.2 Hoeveel observaties zitten er in het model?

Exercise 6.3 Kan je tot twee cijfers na de komma weergeven wat de associatie is tussen CRP en leeftijd (per 10 jaar)?

Exercise 6.4 Noteer hieronder de variabelen die significant zijn (van sterkste associatie naar zwakste associatie in absolute eenheden).

Maak een logistisch regressiemodel waarbij de afhankelijke variabele de status van de patiënt is (waarbij we als uitkomst kijken naar tranferred patiënten). Als onafhankelijke variabelen kunnen jullie gebruik maken van leeftijd, geslacht (REF = vrouw), obesitas, hoge bloed druk en cardiovasculaire aandoeningen (hierbij is bij alle comorbiditeiten “niet aanwezig” de REF). Beantwoord hierna volgende vragen.

Exercise 6.5 Wat is de OR voor cardiovasculair risico?

Exercise 6.6 Hoeveel % is extra correct geclassificeerd als we het model met variabelen beschouwen t.o.v. het model zonder variabelen?

Exercise 6.7 Wat is de p-waarde voor het model?

Exercise 6.8 Wat is het 95% betrouwbaarheidsinterval rond de OR voor geslacht?

DEEL II

Bekijk aandachtig de knipsel uit het artikel Bodin, J., Ha, C., Le Manac’h, A. P., Sérazin, C., Descatha, A., Leclerc, A., … & Roquelaure, Y. (2012). Risk factors for incidence of rotator cuff syndrome in a large working population. Scandinavian journal of work, environment & health, 436-446. Beantwoordt op basis van deze knipsels de vragen zo correct mogelijk. Er is steeds maar één juist antwoord.

Bodin et al. (2012).

Figure 6.1: Bodin et al. (2012).

Exercise 6.9 Op basis van bovenstaande tabel zien we (onderaan) dat de Hosmer-Lemeshow test niet significant is. Wat kunnen we hieruit afleiden?

De model-fit is adequaat en zowel model 1 als model 2 zijn voldoende representatief. De model-fit is inadequaat en de data en het model vertonen sterke discrepanties. De residuen zijn normaal verdeeld en alle voorwaarden van het model zijn voldaan. De residuen zijn niet normaal verdeeld en niet alle voorwaarden van het model zijn voldaan.

Exercise 6.10 Multivariate model in de titel wil zeggen dat…

Er rekening werd gehouden met andere mogelijke verstorende (confouding) variabelen. De OR apart zijn berekend voor elk model en er dus mogelijks confounding kan zijn van de resultaten. Er rekening werd gehouden met meerdere afhankelijke variabelen in het model. Geen van bovenstaande.

Exercise 6.11 Waarom is bij de leeftijdscategorie van <40 een OR van 1 weergegeven en geen 95% CI berekend?

Deze categorie is de referentiecategorie waarmee we de andere categorieën dienen te vergelijken. Dit wil zeggen dat de categorie < 40 jaar niet significant geassocieerd is met verhoogd of verlaagd risico. In deze categorie zaten er onvoldoende observaties om een uitspraak te kunnen doen. Geen van bovenstaande.

Exercise 6.12 In bovenstaand model 2 is er voor de factor “High perceived physical exertionb and repeated and sustained posture with the arms above shoulder level (more or equal then 2h/day)”.

Een significant verhoogd risico wanneer “both factors” aanwezig zijn t.o.v. “one factor”. Zijn de odds voor rotator cuff syndrome (RCS) 3.3 keer hoger in de groep waarbij “both factors” positief zijn t.o.v. “no factor” Er geen significant risico gevonden voor deze factor aangezien de p-waarde niet kleiner is dan 0.01. Geen van bovenstaande.

DEEL III

Probeer onderstaande theoretische vragen zo correct mogelijk te beantwoorden. Er is steeds maar één juist antwoord.

Exercise 6.13 Om een zo correct mogelijk model te bouwen met een lineaire regressie-analyse is het belangrijk dat:

Er een lineair verband bestaat tussen de onafhankelijke en afhankelijke uitkomstmaten. De residuen niet normaal verdeeld zijn en een gelijke variantie hebben. De VIF-waarde kleiner is dan 1, zodat multicollineariteit zoveel mogelijk uitgesloten kan worden. Geen van bovenstaande.

Exercise 6.14 Vul op een zo correct mogelijke manier volgende tabel aan. Geef aan welk cijfer je verwacht in de verschillende vakjes (tot 3 cijfers na de komma). Het gaan om een lineair regressiemodel met 4 ONafhankelijke variabelen.

Invulexamen

Figure 6.2: Invulexamen

Vul hierna de waarden in voor A, B en C.