Bepalen van de tekst herkenningsnauwkeurigheid

Hoe de BIQE OCR Server OCR-nauwkeurigheid bereikt

Beoordeling van de herkenningsnauwkeurigheid als hulpmiddel voor het verkrijgen van het beste resultaat

Informatieherkenning en -extractie zijn belangrijke functies van de BIQE OCR-server. Om onze klanten de beste herkenningskwaliteit te bieden, gebruiken we een van de slimste herkenningsengines ter wereld, ABBYY FineReader Engine. (Op verzoek kunnen we elke andere herkenningsengine gebruiken die de klant wil).

Onze klanten verwerken meestal grote (en zelfs enorme) bestanden (scans, afbeeldingen, pdf). Daarom is het nuttig en belangrijk voor onze klanten om beknopte informatie over de bestandsverwerking te krijgen, zodat ze de kwaliteit van de verwerking kunnen beoordelen en mogelijke problemen kunnen opsporen en corrigeren. Bijvoorbeeld scans van lage kwaliteit, lege pagina’s, omgekeerde pagina’s, afbeeldingen met veel rommel, enz. BIQE OCR server helpt onze klanten om het verwerkingsresultaat gemakkelijk te analyseren en te verbeteren.

BIQE OCR-server toont nuttige samenvattende informatie over de resultaten van het verwerken van elke pagina. Deze informatie is beschikbaar in tabelvorm. Een aparte kolom in deze tabel toont de geschatte waarde van herkenningskwaliteit/nauwkeurigheid voor elke pagina. De operator kan de tabel sorteren op deze kolom en gesorteerde lege pagina’s of pagina’s met een lage herkenningskwaliteitsscore zien. De gebruiker vindt gemakkelijk problematische pagina’s. Vervolgens kan hij ze corrigeren in het algemene pakket van bestanden.

BIQE OCR server helpt onze klanten dus op een handige manier om de kwaliteit van de verwerking te controleren en het beste doelresultaat te verkrijgen.

Score nauwkeurigheid herkenning berekenen

De beoordeling van de herkenningsnauwkeurigheid is het criterium waarop de analyse van het doelresultaat en daarmee de uiteindelijke kwaliteit van de bestandsverwerking is gebaseerd. Daarom moet de schatting van de herkenningsnauwkeurigheid betrouwbaar worden berekend.

Typisch evalueren herkenningsengines het vertrouwen in het herkennen van woorden en individuele tekens. ABBYY inbegrepen. Het betrouwbaarheidsniveau van de herkenning hangt in de eerste plaats af van de kwaliteit van de scan en van enkele andere factoren (bijvoorbeeld semantische analyse).

Het betrouwbaarheidsniveau geeft in feite aan hoe goed de herkenningsengine het teken of woord heeft “herkend”. Dit criterium is nuttig om te beoordelen hoe goed de herkenningsengine getraind is om een bepaalde tekst en lettertype te herkennen. Maar je kunt hiermee niet de nauwkeurigheid van de herkenning evalueren.

Bijvoorbeeld, bij het herkennen van een scan van lage kwaliteit kan het herkenningsresultaat 100% correct en nauwkeurig zijn, maar het niveau van vertrouwen dat de engine geeft kan erg laag zijn. Daarom is dit criterium geen beoordeling van de herkenningsnauwkeurigheid.

Om de score voor herkenningsnauwkeurigheid te berekenen, gebruikt de BIQE OCR-server zijn eigen complexe algoritme. Dit algoritme houdt specifiek niet alleen rekening met de indicator voor het betrouwbaarheidsniveau, maar ook met andere criteria.

Meer informatie?
Neem contact met ons op, we helpen u graag!
info@biqe.biz 

Post adres
Meerweg 17
8313 AK Rutten
Nederland

BIQE OCR Server BIQE OCR Server

  • Onbeperkte snelheid
  • Onbeperkte MRC PDF-compressie
  • Volledig schaalbaar volgens beschikbare cores/threads
  • Unieke hotfolder verwerking

BIQE is uniek!
Onbeperkt scannen - Optimaliseren - OCR
Neem contact met ons op om de mogelijkheden te bespreken.