Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe kan ik bij een studie de data geanonimiseerd verzamelen, maar toch data uit verschillende sessies aan elkaar linken?

0 leuk 0 niet-leuks
Het is vanuit ethisch oogpunt belangrijk, meestal een eis, dat data anoniem wordt verzameld. De beste methode om dit te doen is veruit te voorkomen dat er informatie wordt opgeslagen waardoor het mogelijk is te herleiden wie de data heeft verschaft. Dat is eenvoudig te realiseren bij een crosssectionele studie. Maar, hoe doe je dit bij een longitudinaal onderzoek?

Bij longitudinaal onderzoek is het nodig om emailadressen (of misschien zelfs andere persoonsgegevens te verzamelen), en moeten de datasets bovendien aan elkaar gelinkt worden. Hoe kan ik dat doen terwijl ik de data nog steeds anoniem verzamel?
gevraagd 17 november 2016 in Online vragenlijsten door Gjalt-Jorn Peters (36,260 punten)

1 Antwoord

0 leuk 0 niet-leuks

In deze situaties kan een unieke onderzoekscode worden gebruikt. Er zijn twee manieren om dit te doen.

De eerste is dat de unieke onderzoekscode door in het onderzoek wordt gegenereerd en aan de deelnemer wordt gegeven (bij LimeSurvey kan bijvoorbeeld het participant ID worden gekoppeld aan het laatste cijfer van het uur van de dag, het laatste cijfer van de minuten, en het laatste cijfer van de seconden, om zo een unieke code te genereren per deelnemer). Die moet de deelnemer dan ergens opslaan en de volgende keer weer invullen. Het nadeel is dat mensen die kunnen vergeten.

De tweede is dat een onderzoekscode wordt gegenereerd op basis van persoonlijke gegevens van de deelnemer, op zo'n manier dat op basis van de code, die gegevens niet kunnen worden gereconstrueerd. Dit kan met bijvoorbeeld http://ondrzk.nl of, voor internationaal onderzoek, http://ondrzk.eu. Het voordeel hiervan is dat deelnemers de code steeds opnieuw kunnen genereren; ze kunnen de code niet vergeten of kwijtraken. Het nadeel is dat het in theorie mogelijk is dat twee mensen dezelfde code krijgen (hoewel de selectie van karakters zo is gekozen dat die kans er klein is).

Dus, dit lost het probleem van het koppelen van de data. Rest nog het email adres. De oplossing daarvoor is eigenlijke nog eenvoudiger: maak een vragenlijst aan, met als enige vraag het email adres. Verwijs deelnemers na de eerste sessie naar die andere vragenlijst. Zorg dat in die andere vragenlijst geen datum of tijd wordt opgeslagen, om koppeling met de echte vragenlijst/experiment onmogelijk te maken. Natuurlijk moeten ook geen IP-adressen worden opgeslagen, in geen van de datasets.

In Limesurvey stel je overigens in naar welke URL een deelnemer wordt doorgestuurd na afloopt in 'Edit Text Elements', bij veld 'End URL'.

De 'flow' voor een deelnemer is dan als volgt:

  1. Deelnemers doen mee met eerste sessie
  2. Deelnemers belanden op een pagina waar een link naar http://ondrzk.nl opent in een ander scherm (let op: zorg in LimeSurvey dat er in deze link de code target="_blank" staat, dus in de 'source code' moet je, op de plek waar je de link wil invoeren, het volgende invoeren:

    <a href="http://ondrzk.nl" target="_blank">Hier de tekst voor de link</a>
     
  3. Deelnemers vullen die code in;
  4. Deelnemers worden doorverwezen naar een vragenlijst waar hun email adres wordt opgeslagen
  5. In de volgende sessie worden deelnemers weer verwezen naar de Onderzoekscode pagina, en vullen ze die code weer in.

Et voila: je hebt een lijst met email adressen die los staat van je data, en je kunt vragenlijsten aan elkaar linken zonder breuk van de anonimiteit.

beantwoord 17 november 2016 door Gjalt-Jorn Peters (36,260 punten)
bewerkt 17 november 2016 door Gjalt-Jorn Peters
...