<img src="https://track.adform.net/Serving/TrackPoint/?pm=268420" width="1" height="1" alt="">

GDPR compliant data warehouse #3

1. november 2018 Skrevet af: Jonas Mikkelsen Del med en ven     

Når du overvejer designet til et data warehouse, skal sikkerheden matche den behandling af personoplysninger, der foretages i et data warehouse. Men hvordan vurderer du så hvilke sikkerhedsforanstaltninger, der bør implementeres i et data warehouse? Det kommer vi nærmere ind på her i del 3 om the compliant data warehouse.

Har du læst del 1 og del 2 af the GDPR compliant data warehouse? Du finder dem her: #1 og #2

3 / Matching the needs of the organization

Bestemmelserne om sikkerhed i GDPR kræver, at den dataansvarlige skal implementere passende tekniske foranstaltninger for at sikre et godt sikkerhedsniveau. Hvad er det så for et sikkerhedsniveau? Det kan umiddelbart være svært at vurdere ud fra formuleringen ”passende tekniske foranstaltninger”. At vurdere hvilket sikkerhedsniveau der skal implementeres, er lidt ligesom købe en ny familiebil; man ved, der skal være airbags, Isofix, måske brake-assist og en brandslukker, men præcis hvilket sikkerhedsniveau der er tilstrækkeligt, er relativt svært at gætte. Det, som er sikkert, er, at sikkerhedsniveauet skal være tilstrækkeligt for at imødekomme eller overgå de risici, der er med behandlingen af persondata i et data warehouse.

 

road-min


Der er en lang række foranstaltninger, der skal implementeres i et data warehouse for at sikre compliance. Men vigtigst af alt er at overveje, hvilken type behandling der finder sted og hvordan det behandles.

Her får du en shortlist over de elementer, der matcher organisationens behov, og som skal finde anvendelse på data warehouset:

  1. Det skal være tidsbestemt, hvornår persondata slettes i data warehouse
  2. En auditlog kan hjælpe med at holde overblik og føre kontrol
  3. Et incident detection system kan med fordel opsættes ud fra auditloggen
  4. Backupperiode skal matche organisationens behov
  5. Central brugerstyring
  6. Anonymisering, pseudonymisering og kryptering skal opsættes efter behov

Hvis du eksempelvis laver machine learning på studerende, skal du være særligt obs på afsnit 3.1, som bør være implementeret.

3.1 / Sletning og kontrol

Machine learning angående frafald på studerende kan være med til at forudsige, hvornår en studerende potentielt vil falde fra studiet. I den forbindelse skal der være foretaget en dokumenteret beslutning angående den manuelle/automatiske sletning. Du skal bestemme en klar slettefrist, som er en vurdering ud fra, hvor længe det er relevant at opbevare data. Det skal kontrolleres, at disse frister overholdes. Dette kan gøres vha. en auditlog. Auditloggen kan eksempelvis registrere tidspunktet for sletning eller ændring af data. Herved kan auditloggen hjælpe med at skabe et overblik over hvem og hvornår, der er blevet slettet i data, men den kan også logge antal loginforsøg, ændring i data osv.

Ud fra auditloggen kan der opsættes et incident detection system, som eksempelvis kan monitorere antal login-forsøg. Med dette incident detection system er det at muligt blackliste personer der har haft for mange login-forsøg inden for en given periode.

Det er nødvendigt at opsætte sikkerheden efter den der er opsat. Privatlivspolitikken er den politik, som eksempelvis bliver oplyst en person, som besøger en hjemmeside. Den fortæller bl.a., hvad deres personoplysninger bliver behandlet til, og hvornår oplysningerne bliver slettet. Det er nødvendigt at tilpasse slettefristen/retentionperioden til privatlivspolitikken. Privatlivspolitikken har dog intet at gøre med et data warehouse, men organisationens krav til retentionperioden skal stemme overens med retentionperioden i et data warehouset. Ligeledes kan kontrollering bestemmes af privatlivspolitikken og gennemføres i et data warehouse med hjælp fra auditloggen. Kontrollen gennemføres ved automatisk at udsende push-beskeder til de ansvarlige medarbejder eller i nogle tilfælde læse manuelt i auditloggen.

3.2 / Backup

Der skal foretages backup som sikring mod evt. tab eller forvanskning af data. Retentionperioden på denne backup skal ligeledes være overvejet. Er der tale om behandling af personoplysninger vil en halvårlig backup ikke være tilstrækkelig, en daglig backup er nok nærmere på sin plads. Ydermere er det en en god ide at dokumentere, hvornår persondata også er slettet fra de enkelte backups.

3.3 / Central brugerstyring
Det er særdeles vigtigt, at data ikke bliver udstillet til uvedkommende. Derfor er en god anvendelse af central brugerstyring et must. For at fortsætte i den tidligere terminologi kan det eksempelvis være ved anvendelsen af machine learning på studerendes frafald. De personer, som skal have adgang til data, er de personer, som data er relevant for. Disse personer vil bl.a. være dem, som kan påvirke de studerende i en positiv retning, såsom deres studievejleder eller ledelsen. Derudover er der nødt til at være en BI-udvikler, som kan stå for vedligehold og udvikling af løsningen. Omvendt bør alle personer, som denne information er uvedkommen, være afskærmet fra at se persondata, som ikke er relevant for dem. Dette kan bl.a. sættes op gennem row-level-security. Row-Level-Security gør det muligt for BI-udvikleren at vælge, hvem der har adgang til databaser, tabeller eller rækker i data warehouset.

3.4 / Pseudonomisering, kryptering og anonymisering

Behandling af personoplysninger i et data warehouse skal ligeledes underlægges pseudonomisering og kryptering, hvis det vurderes nødvendigt. Her er det en mulighed at anvende det sikkerhedssetup, som blev foreslået i det tidligere blogindlæg.
Anonymisering kan være en kompleks størrelse at arbejde med. Anonymisering kræver, at personer hverken kan identificeres eller re-identificeres under behandlingen. En mulighed her er at aggregere data til statistik. En anden mulighed er også at fjerne så mange forskellige oplysninger om de personer, der er registreret i data warehouset, således at personerne ikke længere kan identificeres.

3.5  Hvad gør du nu?

  1. Afdæk persondata
  2. Identificer organisationens behov
  3. Match organisationens behov til data warehouset ud fra ovenstående emner
  4. Læn dig tilbage og drik en kop kaffe

Læs med næste gang, hvor vi kommer ind på, hvordan du skal håndtere personers rettigheder.

Vil du vide mere nu?
Hvis du har spørgsmål eller søger kompetent rådgivning og konsulentbistand omkring data warehouse, så tøv ikke med at kontakte Kenneth Yderskov Jørgensen på kyj@inspari.dk / +45 61 95 66 95. Du kan også læse mere om data warehouse og den moderne BI-platform lige her Den moderne BI-platform eller du kan læse om BI-afdelingens ansvar ift. GDPR

Vigtige links til dig: 
The GDPR Compliant Data Warehouse #1
The GDPR Compliant Data Warehouse #2