Wetenschappelijk samenwerkingsplatform om met vereende krachten en privacy respecterend data analyse
Onmiddellijke toegang tot de nieuwste modellen van hoge kwaliteit is van vitaal belang voor de ondersteuning van de beleidsbeslissingen tijdens pandemieën. Daarnaast biedt toegang tot gegevens inzicht in de overdracht van ziekten, voorspellingen van de gevolgen en de effectiviteit van interventies. Door efficiënt gebruik te maken van de wereldwijde kennis en ervaring van de gemeenschap die werkt aan data analyse en modellering (DAM), kunnen belangrijke beslissingen tijdens een pandemie beter worden ondersteund.
Doel
In dit project wordt gestreefd echte gegevens te scheiden van DAM-experts en hen toegang te geven tot dummy- en/of synthetische gegevens in een gecontroleerde omgeving en hun behoeften te bestuderen. Er worden softwaretools aangeboden aan data-eigenaren om ontwikkelde modellen veilig uit te voeren op echte gegevens in een beschermde omgeving en mogelijke manieren te onderzoeken om de kwaliteit en risico's van modellen te kwantificeren. Daarnaast wordt een ontwikkelings- en samenwerkingshub voor modellen ontwikkeld. Deze hub zal fungeren als een werkplek voor DAM-activiteiten en communicatie.
Aanpak/werkwijze
De voorgestelde infrastructuur bestaat uit 3 hoofdelementen:
- De Model Development & Collaboration hub (MDC-hub) biedt DAM-experts wereldwijd een flexibele computeromgeving voor samenwerking, modelontwikkeling en analyses;
- De Trusted Model Validation Environment (TMVE) is een afgeschermde omgeving voor het veilig herbergen van echte gegevens en het draaien van geverifieerde modellen en genereren van gestandaardiseerde prestatierapporten;
- De Model Submission and Leaderboard API (MSLAB-API) wordt aangeroepen vanuit de MDC-hub voor een nieuw model. De prestatierapporten die in de TMVE gegenereerd worden, worden overgebracht naar de MSLAB-API en teruggestuurd naar de modelleur. Het gecontroleerde model met analyse wordt toegevoegd aan een online, volledig transparant open leaderboard.
Samenwerkingspartners
Dit project wordt uitgevoerd door een samenwerkingsverband tussen de Nederlandse organisatie voor toegepast-natuurwetenschappelijk onderzoek (TNO), het Leids Universitair Medisch Centrum en Leiden Universiteit. Ook is het RIVM betrokken bij het project. Hiermee heeft het onderzoeksteam expertise op het gebied van datawetenschappen, computerwetenschappen, digitale gezondheid en epidemiologie.
(Verwachte) resultaten
Dit project creëert een kant-en-klare infrastructuur waarmee modelleurs van over de hele wereld samen snel de best presterende modellen kunnen maken om besluitvormers tijdens een pandemie snelle, transparante en nauwkeurige (beslis-)ondersteuning te bieden. Hindernissen voor gegevenstoegang worden hiermee opgelost door middel van een unieke privacy-by-design aanpak die gevoelige gegevens isoleert van experts, maar toch efficiënte modelontwikkeling mogelijk maakt. Daarnaast wordt de modelontwikkeling versneld door een open-source infrastructuur aan te bieden met actuele gegevens en modellen. Op deze manier kunnen besluitvormers gemakkelijk het beste model op dat moment selecteren voor de betreffende vraag. De resultaten van dit project worden eind 2025 verwacht.