Witte sneeuw valt omlaag in de toets- en examenwereld
Blog
Cor SluijterSenior Consultant Training & Advies
Soms bevat een term of uitdrukking een woord dat al besloten zit in een ander woord in diezelfde term of uitdrukking. Is sprake van zo’n overbodig woord, dan spreken we van een pleonasme. In de titel van deze blog staan er twee. Sneeuw is – normaal gesproken – wit en omhoogvallen is erg lastig. Schrijvers hanteren deze stijlfiguur vaak opzettelijk. Daar hebben ze dan verschillende redenen voor. In het geval van de titel van deze blog bijvoorbeeld om de aandacht te trekken. Maar een pleonasme kan ook grappig bedoeld zijn, of om iets te benadrukken.
Ik vraag me af wat schrijvers van teksten over toetsen en examens voor ogen hebben als zij het pleonasme ‘valide en betrouwbaar’ – de twee belangrijkste kenmerken van een toets of examen – gebruiken.
Weten zij dat het een pleonasme is? En zo ja, wat voor effect beogen zij er dan mee? Is er sprake van bewust gebruik, dus een stijlfiguur? Of is het gewoon een stijlfout of erger nog, een misvatting?
Stijlfiguur of stijlfout?
Een zoekopdracht via Google op de term ‘valide en betrouwbare’ levert zinnen op als: ‘Bij verschillende vakken als onderwijskunde en vakdidactiek heb ik geleerd hoe een valide en betrouwbare toets eruitziet’. En – bij de Rijksuniversiteit Groningen – onder een foto: ‘Afnemen van een valide en betrouwbare toets’. Waarbij dan natuurlijk de vraag is hoe je dat in godsnaam aan die foto kunt zien. Of bij de Erasmus Universiteit: ‘Met een toetsmatrijs zorg je ervoor dat de beoogde leerdoelen in je toets gedekt worden. Dit draagt bij aan een valide en betrouwbare toets.’ En bij de KU Leuven: ‘Een goede, valide en betrouwbare toets doorloopt verschillende ontwikkelfasen.’ Dat lijken toch allemaal geen stijlfiguren te zijn. Maar waarom is er sprake van een stijlfout of een misvatting bij deze schrijvers? Om hier een antwoord op te geven eerst wat meer over de twee begrippen.
Betrouwbaarheid
Net als een weegschaal is een toets een meetinstrument. Van een weegschaal wil je graag dat die je werkelijke gewicht aangeeft. Hij mag er wel een onsje naast zitten, maar zeker geen hele kilo. Zo ook bij een toets. Je wilt dat de scores erop de ‘werkelijke’ scores van leerlingen zo goed mogelijk benaderen. Net als bij een weegschaal kun je bij een toets aangeven hoe nauwkeurig deze meet. Dat doe je met een getal dat tussen 0 en 1 ligt en dat we in toetsjargon de betrouwbaarheid noemen. Hoe nauwkeuriger een toets meet, des te dichter ligt de betrouwbaarheid van de scores op deze toets bij 1. Toetsen die een rol spelen bij belangrijke beslissingen zoals eindtoetsen moeten dus een hoge betrouwbaarheid hebben. De scores erop mogen geen lagere betrouwbaarheid hebben dan 0,80 en de voorkeur gaat uit naar een waarde van minstens 0,90. Zie het beoordelingssysteem van de COTAN (Commissie Testaangelegenheden Nederland van het Nederlands Instituut van Psychologen) voor meer informatie hierover.
Validiteit
Validiteit heeft te maken met de geldigheid van de conclusies die je kunt trekken op basis van een toetsscore. In tegenstelling tot betrouwbaarheid is er aan het begrip validiteit geen getalswaarde te koppelen. Dus is het ook niet mogelijk om concreet aan te geven wanneer sprake is van voldoende validiteit. Ontwikkelaars van een toets hebben de plicht om voldoende bewijs aan te dragen om duidelijk te maken dat een toets meet wat ze ermee beogen te meten. Dus dat de scores op de toets te gebruiken zijn voor het doel waar ze deze voor ontwikkeld hebben. Hoe belangrijker de beslissing, hoe steviger en uitgebreider het bewijs moet zijn. Zie hier ook weer het COTAN-beoordelingssysteem voor meer informatie.
Waarom is ‘valide en betrouwbaar’ een pleonasme?
Als een weegschaal zo onnauwkeurig meet dat het gewicht dat hij aangeeft een paar kilo kan afwijken van je werkelijke gewicht, dan kun je die maar beter niet gebruiken. Als een toets een lage betrouwbaarheid heeft, kun je die ook maar beter niet gebruiken. Je kunt immers geen staat maken op de scores die de toets oplevert. Is een toets onvoldoende betrouwbaar, dan is deze niet in te zetten voor het beoogde gebruiksdoel. Dus per definitie niet valide. Is een toets wél voldoende betrouwbaar, dan moet je nog bepalen of er ook voldoende bewijs is dat hij in te zetten is voor het beoogde doel. Met andere woorden:
Betrouwbaarheid is een noodzakelijke, maar nog geen voldoende voorwaarde voor een toets om valide te zijn. Maar een valide toets is per definitie voldoende betrouwbaar! De term betrouwbaar is dan totaal overbodig.
Nog wat pleonasmen tot slot
Om het nogmaals te herhalen: de term ‘valide en betrouwbaar’ is een pleonasme. Gebruik je die term niet bewust om iets te benadrukken, of om aandacht te trekken, dan maak je een stijlfout. Of erger nog: je geeft er blijk van de twee begrippen onvoldoende te kennen. Dan is naar mijn persoonlijke mening sprake van een verkeerde misvatting.