Tot 2023 was handgeschreven OCR een zwakke plek: 70 procent precisie en frustrerende uitval. Met vision-capable LLMs (GPT-4o, Claude 3.5+, Gemini) zit kwaliteit nu op 90+ procent voor leesbaar handschrift, en op 99 procent voor druk-handschrift.

Vision LLM versus klassieke OCR

Klassieke OCR (Tesseract, Azure Read API, Textract handwriting) is snel en goedkoop, maar struikelt op vage of cursive handschriften. Vision LLM is duurder per pagina en trager, maar levert betere precisie op moeilijke documenten. Hybrid: klassiek eerst, LLM voor wat klassiek niet kan.

Use-cases die nu kunnen

Inkomende ondertekende formulieren met handgeschreven invulling, oude archieven met getypte text plus handgeschreven notes, doktersaantekeningen op formulieren. Niet voor zeer onleesbaar of cursief handschrift; daar blijft handwerk efficienter.

Validatie tegen verwachting

Een geextraheerd handgeschreven nummer valideren we tegen het format dat verwacht wordt (postcode, BSN, telefoon). Een handgeschreven naam valideren tegen klantmaster. Validatie pakt 80 procent van de OCR-fouten zonder dat een mens leest.

Privacy bij sectorale data

Voor zorg- of overheidsdata: vision LLM via Azure OpenAI of AWS Bedrock binnen EU-residency. Geen externe SaaS die uw data niet binnen de relevante regio verwerkt. Wij richten dat in als basis-architectuur.

Verwant: Freelance AI consultant inhuren, AI PDF extractie.