Ghostwork: de onzichtbare wereld van werk achter AI

Claartje ter Hoeven (Universiteit Utrecht) en haar onderzoeksteam maken de verhulde wereld van Europese data- of ghostworkers zichtbaar. Zij zijn vaak hoogopgeleid, willen flexibiliteit, maar hun arbeidsomstandigheden zijn meestal slecht. Wat drijft hen? Welke impact hebben zij op de ontwikkeling van algoritmes, en vice versa?
Ze zijn onzichtbaar, alomtegenwoordig en onmisbaar voor de ontwikkeling van kunstmatige intelligentie (artificial intelligence, AI): 'ghostworkers'. Miljoenen mensen wereldwijd annoteren, controleren en vertalen teksten en plaatjes zodat AI de informatie kan begrijpen en verwerken. Wie zijn deze mensen en wat drijft hen? Hoe zit het met hun welzijn? En welke gevolgen hebben hun slechte arbeidsomstandigheden op de ontwikkeling van AI? Om hier meer over te leren ging ik voor The Gig Work Podcast van de WageIndicator Foundation in gesprek met onderzoeker Claartje ter Hoeven van de Universiteit Utrecht. Zij doet met een European Research Council (ERC) beurs onderzoek naar dit fenomeen.
Annoteren, controleren en corrigeren zodat AI kan leren
Ter Hoeven doet samen met haar team onderzoek naar de arbeidsomstandigheden en het welzijn van zogenaamde 'ghostworkers'. Ze bouwen voort op het werk van Mary Gray en Siddharth Suri, 'Ghost Work: How to Stop Silicon Valley from Building a New Global Underclass'. Terwijl Gray en Suri onderzoek deden naar arbeidsomstandigheden van ghostworkers in de Verenigde Staten en Azië, richten Ter Hoeven en haar onderzoeksteam zich op Europa en onderzoeken ze de relatie tussen de arbeidsomstandigheden en het welzijn van de werkers. Het is een vijfjarig onderzoek en het team is nu ongeveer op de helft.
"We onderzoeken de verborgen arbeid achter AI", vertelt ze. "Ghostwork is een catchy term, maar in de wetenschap noemen we het tegenwoordig liever 'datawork'. Dataworkers maken teksten en foto's leesbaar voor AI, zodat de machine ervan kan leren. Ze geven bijvoorbeeld aan wat een lantaarnpaal of een fiets is, zodat het algoritme van een zelfrijdende auto deze objecten leert herkennen. Ook controleren en corrigeren ze de output van AI-modellen en algoritmes."

Laagbetaald
Dataworkers doen dit vaak vanuit huis via online platformen zoals Amazon Mechanical Turk, Clickworker of Microworkers. Zij krijgen meestal betaald per mini-taakje of 'microtask': een annotatie, controle of vertaling. De beloning is vaak laag en de dataworkers moeten zelf op zoek naar de microtasks op verschillende platformen. Zoeken kost tijd, maar daar krijgen ze niet voor betaald. Vaak verdienen ze minder dan het minimumloon.
Daarnaast zijn er bedrijven die dataworkers in dienst hebben, zogenaamde Business Process Outsourcing organisaties (BPO's). Zij werken op fysieke kantoorlocaties, krijgen vaak per uur betaald en krijgen de taakjes aangeleverd. Hoewel ze geen onbetaalde zoektijd hebben, is ook hun beloning vaak onder de armoedegrens.
We weten nog vrij weinig over deze dataworkers. en veel grote techbedrijven praten liever niet over de bijdrage van mensen in de ontwikkeling van AI, omdat het niet past in het verhaal dat AI 'zelflerend' is. Dat is niet alleen zonde, maar ook schadelijk voor de ontwikkeling van verantwoorde AI. Goed dus dat Ter Hoeven en haar team onderzoek doen naar datawork via platformen in Europa.
Hoogopgeleid met een afstand tot de arbeidsmarkt
Ter Hoeven gebruike diverse onderzoeksmethodes om te ontdekken welke invloed arbeidsomstandigheden van dataworkers hebben op het welzijn van de werkenden. Het begon met een korte enquête. Die hebben zij uitgezet als een microtask op diverse platformen in Europa om zoveel mogelijk reacties te krijgen. Uiteindelijk vulden meer dan 5000 mensen de enquête in.
"Een opvallende uitslag was dat veel dataworkers hoogopgeleid zijn", vertelt de onderzoeker. "Ze hebben vaak een bepaalde afstand tot de arbeidsmarkt. Denk aan migranten of mensen die werk combineren met zorgtaken voor familieleden."
Vier drijfveren
Onder datawerkers die via platformen werken onderscheidt Ter Hoeven aan de hand van haar onderzoek onder ruim 5.000 respondenten vier groepen op basis van hun drijfveren: explorers, enthusiasts, supplementers en dependents:
- Explorers: dit is de grootste groep (73,48%). Zij doen het werk vaak tijdelijk of sporadisch. Hiertoe behoren ook ouderen die het als een soort tijdverdrijf zien. Het is voor hen vergelijkbaar met Candy Crush: ze doen simpele taakjes, verdienen wat geld en leren tegelijkertijd iets leren over automatisering (bijvoorbeeld nieuwe inzichten krijgen over zelfrijdende auto's).
- Enthusiasts: net als de ‘explorers’ is deze categorie werkenden (10,46%) pas onlangs begonnen met platformwerk. Anders dan bij de ‘explorers’ is het meer waarschijnlijk dat deze groep een bovengemiddeld huishoudinkomen heeft en relatief oud is. Deze categorie is omgedoopt tot ‘enthusiasts’, omdat zij niet afhankelijk lijken te zijn van dit werk voor hun inkomen.
- Supplementers: deze mensen (8,08%) gebruiken datawork-platformen om hun inkomen aan te vullen, bijvoorbeeld omdat ze geen fulltime baan hebben of niet genoeg verdienen.
- Dependents: zij (7,98%) zijn volledig afhankelijk van datawork als hun voornaamste bron van inkomen. Zij lijden het meest onder de slechte arbeidsomstandigheden.

Liever een algoritme dan een mens als baas
Ter Hoeven en haar team hielden 137 persoonlijke interviews met dataworkers uit Europa. Ze ontdekte allerlei motivaties. "Wie werkt via platformen, is afhankelijk van algoritmes", zegt ze. "Algoritmes bepalen of jij een taak krijgt en soms ook wat je daarmee verdient. Daar zitten allerlei nadelen aan. Het is vaak onduidelijk hoe algoritmes beslissingen maken en platformen maken het vrijwel onmogelijk om te klagen of discussiëren over besluiten. Toch vertelden veel dataworkers mij tijdens de interviews dat ze liever werken voor een algoritme, dan voor een menselijke manager."
Zo sprak ze een migrant in Duitsland die slechte ervaringen had met vervelende bazen. Dankzij microwork kon hij tenminste werken vanuit huis en zelf zijn werktijden bepalen. Een andere geïnterviewde was een neurowetenschapper met een medische aandoening, waardoor ze 's ochtends meer tijd nodig had om op te staan. Ze moest daardoor stoppen met haar werk aan de universiteit. Dankzij datawork kan zij toch geld verdienen. Ter Hoeven: "Ons onderzoek zegt dus niet alleen iets over microwork, maar roept ook vragen op over de manier waarop we meer traditioneel werk organiseren."
Behoefte aan collega's en waardering
De onderzoekers presenteren hun bevindingen niet alleen op papier, maar ook in een documentaire. Zij nodigden zes Europese dataworkers uit voor video-opnames. "We stelden ze vragen en brachten ze bij elkaar voor paneldiscussies", vertelt de onderzoeker. "Dit cinematic research bood heel interessante inzichten."
De trailer van de film 'Ghost Workers', gemaakt door Lisette Olsthoorn in samenwerking met het team van Claartje ter Hoeven aan de Erasmus Universiteit. Deze film is mogelijk gemaakt door het Erasmus Initiative Societal Impact of AI en door de European Research Council (ERC) in het kader van het onderzoeks- en innovatieprogramma Horizon 2020 van de Europese Unie (subsidieovereenkomst nr. 101003134).
Terwijl de meeste dataworkers tijdens de interviews aangaven dat ze doorgaans geen collega's misten, bleek tijdens de opnames dat ze daar wel degelijk behoefte aan hadden. "Ineens konden ze klagen, sparren en ervaringen delen met gelijkgestemden", vertelt Ter Hoeven. "Ze hadden gewoon nog nooit een dataworker-collega gehad. Verder zag ik hun zelfvertrouwen groeien tijdens de opnames nu zij het waren die in de spotlights stonden. Dataworkers hebben misschien meer behoefte aan contact en waardering dan ze zelf soms denken."
Kwaliteit van de data
Datawork roept een hoop vragen op. Die gaan niet alleen over het welzijn van medewerkers, maar ook over de kwaliteit van de data. AI heeft een steeds grotere invloed op ons dagelijks leven. Ter Hoeven: "Een voorbeeld: sommige dataworkers annoteren medische procedures. Ze moeten bijvoorbeeld aangeven of de hand van een arts trilt tijdens een operatie. Maar deze mensen hebben meestal geen medische achtergrond. Hoe betrouwbaar is die data dan?"




Foto's van enkele dataworkers die deelnamen aan het 'GHOSTWORK' onderzoek. Foto's door Phil Nijhuis / Erasmus University Rotterdam
Welke gevolgen heeft het al AI leert van mensen zonder voldoende vakkennis en informatie over de context van de data die ‘vertaald’ moet worden? Om de kwaliteit te verbeteren, kan het verstandig zijn om de vaardigheden van medewerkers beter te laten aansluiten op de taken en hen beter te begeleiden. Dat kan alleen als je meer investeert in dataworkers.
Meer transparantie
In haar boek The Tech Coup bespreekt Marietje Schaake hoe techbedrijven real-time experimenten uitvoeren met gebruikersdata om hun platformen te optimaliseren, vaak zonder dat gebruikers hiervan op de hoogte zijn. Dit kan ernstige gevolgen hebben voor privacy, democratie en persoonlijke vrijheid. Daarom pleit zij voor strengere regulering en meer transparantie.
Dat geldt ook hier. Volgens mij zouden organisaties transparanter moeten zijn over de bijdragen van dataworkers en de mogelijke risico's daarvan. Ik hoop dan ook dat Europese wetgeving als de Corporate Sustainability Due Diligence Directive (CSDDD) ook van toepassing is op de manier waarop bedrijven hun AI ontwikkelen. Deze slimme technologie heeft namelijk steeds meer invloed op allerlei processen. Kortom, het gesprek met Ter Hoeven leidt bij mij weer tot veel nieuwe vragen. Daar ga ik in deze podcast de komende maanden antwoord op zoeken.
Meer weten? Beluister hier het hele interview in The Gig Work Podcast.
Het GHOSTWORK-project heeft financiering ontvangen van de Europese Onderzoeksraad (ERC) in het kader van het Horizon 2020-programma voor onderzoek en innovatie van de Europese Unie Subsidieovereenkomst nr. 101003134
