Art. 15 vraagt dat high-risk AI passend niveau van accuracy, robustness en cybersecurity heeft. "Passend" is contextafhankelijk; wij vertalen het naar concrete drempels per use-case.
Accuracy-metrics en thresholds
Per use-case: precision, recall, F1, AUC of context-specifieke metrics (BLEU voor vertaling, ROUGE voor samenvatting). Thresholds vastgesteld op basis van impact: hoge stake (medisch, juridisch) hogere threshold dan lage stake (klantenservice triage).
Robustness tegen edge cases
Hoe presteert het systeem op out-of-distribution input? Adversarial examples, noise, incomplete data, atypische combinaties. Stress-testing en chaos-engineering voor AI-systemen. Een systeem dat alleen op clean test-data goed werkt is niet productie-klaar.
Cybersecurity-eisen
Bescherming tegen prompt injection, model-extraction, training-data-poisoning, evasion attacks. Audit van model-endpoints. Encryption-at-rest en in-transit. Voor systemen achter API: rate limiting, authentication, monitoring.
Doorlopende meting
Accuracy en robustness in productie monitoren, niet alleen pre-deployment. Drift-detectie, performance-degradatie-alerts, periodieke retesting. Voor bij audit-momenten cijfermatige reproduceerbaarheid.
Verwant: Freelance AI consultant inhuren, AI Act post-market.