Onderzoeksresultaat: Sociale processen ontrafelen met data en rekenkracht
Sociaalwetenschappers hebben er een krachtig instrument bij. Door de combinatie van datasets én een supercomputer kunnen er nieuwe onderzoeksvragen worden beantwoord. ‘Het koppelen van administratieve data met gegevens uit open enquêtes is nergens anders ter wereld mogelijk.’
‘Het sociale tapijt van Nederland’, noemt Tom Emery uitvoerend directeur van ODISSEI, de dataset waarin de relaties van alle Nederlanders in kaart zijn gebracht. Wie is jouw familie en wie zijn jouw collega’s, je klasgenoten en je buren? Welke mensen staan centraal in jouw netwerk en welke staan verder van je af? In een samenwerking onder leiding van het Centraal Bureau voor de Statistiek (CBS) zijn tachtig miljoen onderlinge relaties van Nederlanders, en 16,9 miljoen knooppunten in die relaties, in kaart gebracht. Met behulp van deze netwerkanalyse is bijvoorbeeld recent onderzoek gedaan naar segregatie. Hieruit blijkt dat mensen met een hoog inkomen en zonder migratieachtergrond het meest in hun eigen sociale bubbel verkeren. Zij hebben relatief het minste contact met mensen met een andere achtergrond.
Sociale processen ontrafelen met data en rekenkracht Sociaalwetenschappers hebben er een krachtig instrument bij. Door de combinatie van datasets én een supercomputer kunnen er nieuwe onderzoeksvragen worden beantwoordt. ‘Het koppelen van administratieve data met gegevens uit open enquêtes is nergens anders ter wereld mogelijk.’
Zonder ODISSEI (Open Data Infrastructure for Social Science and Economic Innovations) was een dergelijk onderzoek niet mogelijk. De infrastructuur brengt verschillende grote databronnen samen. Denk aan feitelijke gegevens van het CBS en de Belastingdienst over onder andere inkomen, woonadres en land van herkomst. Maar ook aan meer descriptieve gegevens uit enquêtes, zoals het LISS-panel (Langlopende Internet Studies voor Sociale wetenschappen) waaraan zo’n vijfduizend mensen meedoen en dat financieel mogelijk gemaakt wordt door ODISSEI. Respondenten beantwoorden maandelijks vragen over bijvoorbeeld hun politieke voorkeur en hun houding ten aanzien van werk, sport, gezondheidszorg of onderwijs. Onderzoekers kunnen deze (geanonimiseerde) data in een streng beveiligde online omgeving inzien. Daarbovenop biedt ODISSEI veel rekenkracht, door toegang te ontsluiten tot de supercomputer Snellius van SURF. ‘In het verleden was een netwerkanalyse op zo’n grote schaal niet mogelijk, omdat we daar simpelweg de computerkracht niet voor hadden’, vertelt Emery. ‘Nu we dat wel hebben, wordt een brede waaier aan nieuw onderzoek mogelijk. We kunnen vragen beantwoorden die altijd buiten ons bereik lagen.’
De Brit Emery, die ook socioloog is aan de Erasmus Universiteit, verhuisde tien jaar geleden naar Nederland, speciaal vanwege de mogelijkheden voor sociaalwetenschappelijk onderzoek. ‘Administratieve data van het CBS zijn fantastisch omdat alle Nederlanders erin staan en ze vrij accuraat zijn. Maar ze missen informatie over bijvoorbeeld de houding, gevoelens en overtuigingen van mensen. In ODISSEI kunnen we data van open enquêtes, zoals die van het LISS-panel, koppelen. Dat is nergens anders ter wereld mogelijk.’ Het werd daarom de missie van ODISSEI om deze gegevensbronnen én rekenkracht op een veilige manier samen te brengen. Doordat de infrastructuur werd opgenomen in de Nationale Roadmap Grootschalige Wetenschappelijke Infrastructuur van NWO, kwam er in 2020 financiering om deze plannen verder te kunnen uitvoeren. Volgend jaar bestaat ODISSEI alweer tien jaar, en met duizenden gebruikers is het een populair onderzoeksinstrument voor sociale wetenschappers geworden.
AI-taalmodellen trainen
Die populariteit is deels te verklaren door de vele manieren waarop onderzoekers ODISSEI kunnen gebruiken. Zo is het op grote schaal mogelijk om door middel van spelsituaties te onderzoeken welke keuzes mensen maken in een bepaalde situatie. Vaak worden zulke onderzoeken met kleine groepen gedaan, maar dat kan nu ook met de deelnemers uit het LISS-panel, waardoor de uitkomsten meer representatief zijn voor de hele Nederlandse bevolking.
Lees het volledige nieuwsbericht op www.nwo.nl.