DE BASICS VAN DATABESCHERMING (deel 2)
Grootschalige datalekken bij ODIDO, Clinical Diagnostics en Dienst Justitiële Inrichtingen. Ze maken mensen het leven zuur en zijn helaas aan de orde van de dag.
Daarom besloot ik een paar stukjes te schrijven over preventieve technieken.
In mijn vorige stuk (https://hear-me.social/@joepbc/116125280522155344) schreef ik over ‘Fijnmazig toegangsbeheer’, tegen lekken en identificatie.
Identificatie tegengaan werkt alleen als data geen eenvoudig identificerende identifiërs heeft. En daarom wil ik vandaag iets vertellen over:
* Micropseudonimisatie! *
Een bloedgroep, een allergie of een rapportcijfer an sich is niet zo gevoelig. Laat ik een paar voorbeelden geven: O-, Coeliakie en 8+.
Ik heb van niemand een verwerkingsgrondslag nodig voor bovenstaande zin. Zelfs zelfs niet als ze van studenten van studie X zijn (in werkelijkheid heb ik ze uit de mouw geschud).
Het wordt minder prettig voor deze studenten als ik hun namen of BSN-nummers erbij zou geven. Maar als ik een studie wil doen naar eiwitten in bloed bij bloedgroepen, heb ik die namen of BSN-nummers niet nodig. Als iemand een glutenvrije maaltijd wil bestellen is die informatie ook niet nodig. En een computersysteem dat een studieadvies geeft... idem dito.
Toch kunnen we hier geen gebruik maken van ‘anonieme’ gegevens (een veelgemaakte verwarring). De bloedgroep hoort bij andere persoonsgegevens. In de kantine wil je dat de juiste maaltijd terechtkomt bij de persoon met de allergie, en een studieadvies hoort ook bij iemand.
En toch kan de bloed-analist werken zonder de student te identificëren. De kok werkt op basis van een bestelnummer. Het computersysteem kan cijfers analyseren zonder te weten over wie ze gaan.
Allemaal dankzij *Micropseudonimisatie!*
We werken met ‘codes’ die voor de rest van de wereld niets betekenen.
Vaak wordt al gewerkt met pseudoniemen. Bijvoorbeeld door een naam of BSN te vervangen door een studentnummer. Maar als je vervolgens alle verwerkingen doet op basis van studentnummers wordt het studentnummer an sich ook een identificerende code. Gevoelsmatig zul je ook vinden dat het niet nodig moet zijn om je studentnummer met de keuken te delen als je iets wil eten.
Een computersysteem kan studieresultaten analyseren en er een advies bij geven zonder te weten over wie het gaat. Ook dit systeem, waar misschien ook andere (systeem)beheerders toegang toe hebben, geven we liever een eenmalige code. Mogelijk altijd dezelfde code bij dezelfde student, maar altijd een ‘identifier’ die verder voor niemand op de wereld relevantie heeft.
Als dat computersysteem gehackt wordt, of de (systeem)beheerder ervan omgekocht, dan zijn de cijfers met die codes bijna waardeloos.
Dan hebben we alleen nog een systeem nodig om die codes (micropseudoniemen) allemaal aan elkaar te koppelen, in combinatie met het databeheer van de vorige keer, zonder dat er daardoor weer iemand komt die bij al die data mag. Ook dat is mogelijk! Daarover later meer!
Stay tuned!