De voorspellende waarde van een assessment is voor veel organisaties een belangrijke reden om assessments in te zetten bij selectie. De gedachte is eenvoudig: hoe beter je vooraf kunt inschatten hoe iemand zal functioneren, hoe kleiner de kans op een mismatch. Maar hoe goed werkt dat eigenlijk in de praktijk?
Assessments leveren waardevolle inzichten op, maar de vraag is niet alleen óf ze voorspellen, maar vooral wat ze precies voorspellen en waar de grenzen liggen. Functioneren in een rol is namelijk complexer dan het op het eerste gezicht lijkt.
De discussie over de voorspellende waarde van een assessment wordt vaak teruggebracht tot één getal: de correlatie, meestal aangeduid met r. Dat getal suggereert een mate van precisie en objectiviteit. Achter die ogenschijnlijke eenvoud schuilt echter een complexere realiteit. Want zelfs wanneer je weet hoe sterk een assessment samenhangt met later functioneren, blijft de vraag wat dat functioneren precies omvat en in hoeverre dat zich laat vangen in één enkele maat.
Dit is misschien niet de meest voor de hand liggende boodschap vanuit een assessmentbureau. Het zou eenvoudiger zijn om zekerheid te suggereren en de voorspellende kracht groter te laten lijken dan deze in werkelijkheid is. Toch geloven wij dat juist realisme en transparantie de basis vormen voor goede selectiebeslissingen. Niet omdat assessments minder waardevol zijn, maar omdat hun kracht pas echt zichtbaar wordt wanneer je begrijpt wat ze wel én niet kunnen voorspellen.
In gesprekken over assessments wordt vaak gesproken over “betrouwbaarheid”. Dat klinkt logisch, maar is in deze context niet het juiste begrip. Betrouwbaarheid gaat over de kwaliteit van de meting zelf – bijvoorbeeld of een vragenlijst consistent meet wat hij moet meten. Waar het hier om gaat, is iets anders: de relatie tussen assessmentuitkomsten en gedrag in de praktijk.
Dat noemen we de voorspellende waarde of predictieve validiteit. Het gaat dus niet om de vraag of een test technisch klopt, maar om de vraag of de uitkomst iets zegt over hoe iemand later functioneert in een rol.
Wanneer een assessment zorgvuldig wordt ontworpen en meerdere goed onderbouwde methoden combineert, kan een relatief sterke voorspelling worden gedaan. Denk aan een combinatie van gestructureerde interviews, cognitieve capaciteiten, persoonlijkheid en drijfveren.
Op basis van recente inzichten ligt de bovengrens van wat realistisch haalbaar is rond:
r ≈ 0,55 – 0,60
Binnen de gedragswetenschappen is dat een stevige uitkomst. Tegelijkertijd is het essentieel om te begrijpen wat dit betekent. Een correlatie van 0,55 betekent niet dat je 55% van succes voorspelt. Het gaat om het kwadraat van die correlatie, wat neerkomt op ongeveer 30% verklaarde variantie. Bij 0,60 is dat ongeveer 36%.
Met andere woorden: zelfs een goed uitgevoerd assessment verklaart ongeveer een derde van de verschillen in functioneren. De rest blijft onzeker.
De voorspellende waarde die in onderzoek wordt gevonden, heeft in belangrijke mate betrekking op hoe goed iemand zijn of haar werk inhoudelijk uitvoert. De criteria die in dit type onderzoek worden gebruikt – zoals productiviteit, kwaliteit van werk en beoordelingen door leidinggevenden – zijn sterk verbonden met de uitvoering van kerntaken.
Daarmee geven deze cijfers vooral inzicht in de mate waarin een assessment kan voorspellen of iemand in staat is om de inhoudelijke eisen van een functie goed aan te kunnen. Dat is een belangrijk onderdeel van functioneren, maar niet het volledige beeld.
In de praktijk wordt succes namelijk ook bepaald door hoe iemand zich gedraagt in de bredere context van de organisatie.
Naast taakprestatie spelen gedragingen een rol die minder direct gekoppeld zijn aan de formele functie-inhoud, maar wel degelijk bepalend zijn voor succes. Het gaat dan bijvoorbeeld om de mate waarin iemand samenwerkt, initiatief toont, anderen ondersteunt en bijdraagt aan een positief werkklimaat. Dit wordt vaak aangeduid als Organizational Citizenship Behavior (OCB).
Dit soort gedrag is lastiger te voorspellen, omdat het sterk afhankelijk is van de context waarin iemand terechtkomt. De manier waarop een team functioneert, de stijl van leidinggeven en de mate van vertrouwen binnen de organisatie beïnvloeden in hoge mate of dit gedrag daadwerkelijk tot uiting komt.
Daarnaast bestaat er ook gedrag dat prestaties juist ondermijnt, zoals weerstand, terugtrekgedrag of conflicten. Ook dit zogenoemde contraproductieve werkgedrag is slechts beperkt vooraf te voorspellen. Persoonlijkheid en integriteit geven aanwijzingen, maar de uiteindelijke uiting van dit gedrag wordt in sterke mate bepaald door de omstandigheden in de praktijk.
De voorspellende waarde van een assessment is dus niet gelijk verdeeld over alle vormen van functioneren. Waar inhoudelijke taakuitvoering nog relatief goed te voorspellen is, geldt dat in mindere mate voor samenwerking, motivatie en gedrag in complexe sociale situaties.
Als de voorspellende waarde van een assessment in de praktijk een bovengrens heeft van ongeveer r ≈ 0,55–0,60, ontstaat automatisch de vraag: hoe kom je daar zo dicht mogelijk bij in de praktijk? Het antwoord ligt niet in één specifieke test of methode, maar in de kwaliteit van het totale ontwerp en de uitvoering van het assessment.
De basis ligt bij een scherpe context- en functieanalyse. Voorspellen kan alleen wanneer helder is wat succes in de rol daadwerkelijk betekent. Dat vraagt om meer dan een generiek functieprofiel. Het gaat om inzicht in de specifieke context: welke situaties zijn bepalend voor succes, welke gedragingen maken het verschil, waar zitten de grootste risico’s en welke dynamiek kenmerkt de organisatie en het team. Zonder deze analyse blijft een assessment al snel generiek, en daarmee minder voorspellend.
Vervolgens is de manier waarop het interview wordt ingericht cruciaal. Onderzoek laat consequent zien dat gestructureerde interviews aanzienlijk voorspellender zijn dan ongestructureerde gesprekken. Dat betekent concreet dat alle kandidaten dezelfde vragen krijgen, in dezelfde volgorde, waarbij de vragen direct gekoppeld zijn aan het gedrag dat in de functie nodig is. De antwoorden worden per vraag afzonderlijk beoordeeld, bij voorkeur op een numerieke schaal met vooraf gedefinieerde gedragsankers die beschrijven wat sterke en minder sterke antwoorden zijn. Wanneer meerdere beoordelaars betrokken zijn, beoordelen zij onafhankelijk van elkaar, zonder tussentijds overleg. Juist die standaardisatie en onafhankelijkheid zorgen ervoor dat het interview minder gevoelig wordt voor bias en daarmee voorspellender wordt.
Daarnaast speelt cognitieve capaciteit een belangrijke rol. Cognitieve capaciteitentests behoren tot de meest robuuste voorspellers van taakprestatie, met name in functies waarin probleemoplossend vermogen, leervermogen en abstract denken centraal staan. Het toevoegen van een goed onderbouwde capaciteitentest verhoogt de voorspellende waarde van het assessment, mits deze passend is bij het niveau en de inhoud van de functie.
Minstens zo belangrijk is de kwaliteit van de gebruikte vragenlijsten en tests. Niet elk instrument is geschikt voor selectie. Instrumenten die door de COTAN op alle relevante criteria – zoals betrouwbaarheid, begripsvaliditeit en criteriumvaliditeit – als voldoende tot goed worden beoordeeld, bieden een veel stevigere basis. Het gebruik van dergelijke onderbouwde instrumenten voorkomt dat conclusies worden getrokken op basis van metingen die inhoudelijk of psychometrisch onvoldoende zijn.
Tot slot is de kwaliteit van de interpretatie en rapportage bepalend. Een assessment dat alleen beschrijft wat iemand scoort, mist de kern. De meerwaarde zit in het duiden van wat dat betekent in deze specifieke context. Waar liggen de kansen op succes? Onder welke omstandigheden komt iemand tot zijn recht? En waar zitten de risico’s die aandacht vragen in onboarding en aansturing?
Wanneer al deze elementen samenkomen – een scherpe contextanalyse, gestructureerde en gestandaardiseerde interviews, valide meetinstrumenten zoals cognitieve capaciteitentests en een zorgvuldige integratie van bevindingen – benader je de maximale voorspellende waarde die in selectie haalbaar is. Niet omdat je daarmee zekerheid creëert, maar omdat je de beschikbare informatie zo optimaal mogelijk benut om onzekerheid te verkleinen en risico’s expliciet te maken.
De vraag die organisaties uiteindelijk bezighoudt is hoe groot de kans is dat zij een verkeerde keuze maken. Zelfs bij een zorgvuldig ingericht assessmentproces blijft die kans aanwezig. In de praktijk betekent dit dat er, ondanks een sterke voorspellende waarde, een reële kans blijft dat iemand niet optimaal functioneert in de rol.
Om die kans beter te duiden, is het nodig om kort stil te staan bij wat de voorspellende waarde van een assessment precies betekent. In optimale omstandigheden ligt deze rond een correlatie van r ≈ 0,55 tot 0,60. Deze correlatie geeft de samenhang weer tussen de uitkomsten van het assessment en het latere functioneren. Om te bepalen welk deel van de verschillen in functioneren hiermee wordt verklaard, wordt de correlatie gekwadrateerd (r²). Dat betekent dat een correlatie van 0,55 neerkomt op ongeveer 0,30, en een correlatie van 0,60 op ongeveer 0,36. Met andere woorden: een goed assessment verklaart grofweg 30 tot 36 procent van de verschillen in functioneren.
Dit impliceert tegelijkertijd dat een aanzienlijk deel van het functioneren niet vooraf te voorspellen is. Het grootste deel van wat bepaalt of iemand succesvol is in een rol, ontstaat namelijk pas in de praktijk, in de wisselwerking tussen persoon, functie en context. Factoren zoals teamdynamiek, leiderschap, veranderende verwachtingen en motivatie over tijd spelen hierin een belangrijke rol en laten zich slechts beperkt vooraf meten.
Wanneer je deze resterende onzekerheid vertaalt naar selectiebeslissingen, ontstaat een realistisch beeld van de kans op een mismatch. Die kans is niet exact in één percentage te vangen, maar ligt in veel praktijksituaties ergens tussen de 25 en 40 procent. Dit is geen harde statistische uitkomst, maar een onderbouwde duiding van hoe voorspellende validiteit zich vertaalt naar beslissingen in de praktijk.
Het is daarbij belangrijk om te beseffen dat een mismatch zich niet alleen uit in duidelijk tegenvallende taakprestaties. In veel gevallen gaat het om subtielere vormen, zoals samenwerking die minder soepel verloopt, een stijl die niet goed aansluit bij de leidinggevende, of een context waarin iemand minder tot zijn recht komt dan vooraf werd verwacht. Juist deze vormen van mismatch zijn moeilijk volledig te voorspellen, omdat ze sterk afhankelijk zijn van factoren die zich pas na indiensttreding manifesteren.
Dit maakt ook duidelijk waarom de uitspraak “de juiste persoon op de juiste plek” te absoluut is. Het suggereert een mate van zekerheid die in de praktijk niet bestaat. Wat een assessment wél doet, is die onzekerheid verkleinen en beter inzichtelijk maken waar de grootste risico’s liggen, zodat organisaties bewustere en beter onderbouwde keuzes kunnen maken.
De grootste fout die organisaties maken, is dat zij een assessment zien als een eindpunt: een moment waarop een oordeel wordt geveld. Geschikt of niet geschikt. Wel of niet aannemen.
Daarmee wordt slechts een deel van de waarde benut.
De echte kracht van een assessment komt pas naar voren wanneer het wordt gebruikt als startpunt voor de fase daarna. De inzichten die tijdens het assessment zijn opgebouwd, geven namelijk concrete richting aan hoe iemand het beste kan worden begeleid, aangestuurd en ontwikkeld.
Bijvoorbeeld: als zichtbaar wordt dat iemand sterk analytisch is maar geneigd is besluitvorming uit te stellen, kan daar in de eerste maanden bewust op worden gestuurd. Blijkt iemand onder druk directiever te worden, dan kan een leidinggevende daar alert op zijn en tijdig feedback geven. En als iemand het beste functioneert in een context met duidelijke kaders, kan daar in de inrichting van de rol rekening mee worden gehouden.
Op die manier verschuift het assessment van een selectiemiddel naar een instrument dat actief bijdraagt aan succes in de praktijk.
De kans op succes wordt dan niet alleen bepaald door hoe goed je vooraf hebt voorspeld, maar ook door hoe goed je de verkregen inzichten benut.