Evaluation of methods for handling missing data in diagnostic research
De medische wereld maakt vaak gebruik van modellen die op basis van gegevens van een patiënt inschatten hoe groot de kans is op bijvoorbeeld de aanwezigheid van een ziekte of op het succes van een behandeling. Deze modellen worden opgebouwd aan de hand van tal van gegevens van een grote groep patiënten. In de praktijk ontbreek vaak van sommige patiënten een aantal gegevens. De vraag is hoe hiermee om te gaan bij het ontwikkelen van het model. Alleen de patiënten gebruiken van wie alle gegevens voor handen zijn? Of een schatting maken van de ontbrekende waarden? Dit laatste kan door één waarde te schatten (enkelvoudige imputatie) of verschillende waarden (meervoudige imputatie). In Utrecht is aan de hand van een bestaande set (complete) gegevens onderzocht wat de gevolgen zijn voor de betrouwbaarheid van het model als op verschillende manieren ontbrekende waarden worden geschat. De methode van meervoudige imputatie blijkt te leiden tot de beste benadering van de werkelijkheid.