Selection in Surveys

For dette formålet bruker vi en spørreundersøkelse om arbeidsmarkedsforhold under COVID-19-pandemien der randomiserte finansielle insentiver ble benyttet for å motivere svardeltagelse. Ved å linke dataene fra spørreundersøkelsen til administrative registre kan vi observere den sanne arbeidsmarkedstilknytningen for både deltagere og ikke-deltagere. Vi finner at frafallsskjevheten er stor, selv etter å ha korrigert for observerbare forskjeller mellom deltagere og ikke-deltagere. Vi anvender en rekke eksisterende metoder fra økonometrisk litteratur på missing data og programevaluering som tar høyde for frafallsskjevhet som skyldes uobserverbare forskjeller. Metodene inkluderer worst-case bounds, bounds som innlemmer monotonisitetsantakelser, og tilnærminger basert på parametriske og ikke-parametriske seleksjonsmodeller. Metodene produserer bounds (eller punktestimater) som er enten for vide for å være nyttige, eller langt unna sannheten. Vi viser at disse svakhetene forbedres ved å modellere hvordan frafall kan være både aktivt (personen velger å ikke svare) og passivt (personen ser ikke invitasjonen til å svare på undersøkelsen). Modellen bruker variasjon i randomiserte finansielle insentiver, i tillegg til tidspunkt for påminnelseseposter. Ved å anvende modellen på våre data finner vi bounds (eller punktestimater) som er tettere og nærmere sannheten enn de andre metodene.

Oppsummert viser funnene våre at svarprosenter kan være en misvisende indikasjon på frafallsskjevheter i spørreundersøkelsesdata, og bør derfor ikke være viktigste målparameter når man utformer spørreundersøkelser. Isteden er det viktig at det er mulig å teste og korrigere for frafallsskjevhet. Vi viser at ved å randomisere insentiver for deltagelse kan man korrigere for uobserverbare forskjeller mellom de som deltar og ikke deltar i undersøkelsen