Metrics
Metrics zijn de meetlat van AI. Of je nu een AI-model bouwt dat e-mails classificeert of gezichten herkent: je wil weten of het werkt. En dat doe je met metrics. Zonder die cijfers zit je eigenlijk maar wat te gokken. Metrics vertellen je zwart-op-wit hoe goed (of slecht) je model presteert en waar er ruimte is voor verbetering.
Inhoudsopgave
De cijfertjes achter het model
Metrics zijn evaluatiecijfers. Ze geven je inzicht in hoe accuraat, betrouwbaar of efficiënt een AI-model is. Net als bij een schoolrapport kijk je naar meerdere vakken. Denk aan nauwkeurigheid (accuracy), precisie (precision), recall en F1-score. Elk van die cijfers vertelt je iets anders en samen geven ze een compleet beeld van de prestaties van je model.
Niet elke metric vertelt hetzelfde verhaal
Stel, je bouwt een AI-model dat moet voorspellen of iemand fraude pleegt. Dan wil je niet alleen weten hoe vaak het goed zit (accuracy), maar ook hoe vaak het model alarm slaat terwijl er niks aan de hand is (false positives). En hoe vaak mist het juist echte fraudegevallen (false negatives)? In zulke gevallen zegt één metric dus niet genoeg – je moet breder kijken.
De bekendste AI-metrics
AI kent een hele rits aan metrics, maar dit zijn de usual suspects:
- Accuracy: Hoeveel voorspellingen zijn correct?
- Precision: Hoeveel van de positieve voorspellingen zijn echt juist?
- Recall: Hoeveel van de echte positieven heeft het model gevonden?
- F1-score: Een slimme balans tussen precision en recall.
- ROC AUC: Geeft aan hoe goed het model onderscheid maakt tussen categorieën.
Welke metric je gebruikt, hangt af van je doel. Bij spamdetectie wil je misschien liever iets te vaak dan te weinig markeren. Bij medische diagnoses geldt juist het omgekeerde.
Slim kiezen is goud waard
Een goede metric kiezen is minstens zo belangrijk als een goed model trainen. Het bepaalt hoe je de resultaten interpreteert en dus ook welke verbeteringen je doorvoert. Blindstaren op één cijfer is gevaarlijk: het kan zijn dat je model op papier fantastisch scoort, maar in de praktijk fouten maakt die je liever vermijdt.
Veelgestelde vragen
Accuracy kijkt naar alle voorspellingen samen. Precision kijkt specifiek naar hoe ‘zuiver’ de positieve voorspellingen zijn.
Omdat elk AI-probleem anders is. Je hebt andere cijfers nodig bij een fraudemodel dan bij een beeldherkenningstool.
Dat hangt af van je toepassing. In sommige gevallen is recall cruciaal, in andere juist de precision of F1-score.
Zeker! Sterker nog: dat is vaak juist verstandig. Zo krijg je een gebalanceerd beeld van je modelprestaties.
Gerelateerde begrippen
- AI-algoritmes
- AI-gegenereerde websites
- AI-model
- Augmented Intelligence
- Autonome AI
- Binary Search Tree (BST)
- Breadth-First Search (BFS)
- Chatbot
- Classificatie
- Claude
- Conversational AI
- DALL·E
- Deep Learning
- Deepfake
- DeepMind
- Edge AI
- Ethische AI
- Gemini
- Generatieve AI
- Generative Adversarial Network (GAN)
- Generative Pre-trained Transformer (GPT)
- Generator
- Hallucinatie
- Learning curve