Bewertung der Tekst Erkennungsgenauigkeit

Wie der BIQE OCR Server die OCR-Genauigkeit erreicht

Bewertung der Erkennungsgenauigkeit als Instrument zur Erzielung des besten Ergebnisses

Die Erkennung und Extraktion von Informationen sind wichtige Funktionen des BIQE OCR-Servers. Um unseren Kunden die beste Erkennungsqualität zu bieten, verwenden wir eine der intelligentesten Erkennungsmaschinen der Welt, die ABBYY FineReader Engine. (Auf Anfrage können wir auch jede andere Erkennungs-Engine verwenden, die der Kunde wünscht.)

Unsere Kunden verarbeiten in der Regel große (und sogar riesige) Dateianlagen (Scans, Bilder, PDF). Daher ist es für unsere Kunden nützlich und wichtig, zusammenfassende Informationen über die Dateiverarbeitung zu erhalten, um die Qualität der Verarbeitung zu beurteilen und mögliche Probleme zu erkennen und zu beheben. Zum Beispiel Scans von schlechter Qualität, leere Seiten, umgedrehte Seiten, Bilder mit viel Müll usw. Der BIQE OCR Server hilft unseren Kunden, das Verarbeitungsergebnis bequem zu analysieren und zu verbessern.

Der BIQE OCR-Server zeigt nützliche zusammenfassende Informationen über die Ergebnisse der Verarbeitung jeder Seite an. Diese Informationen sind in tabellarischer Form verfügbar. Eine separate Spalte in dieser Tabelle zeigt den geschätzten Wert der Erkennungsqualität/Genauigkeit für jede Seite an. Der/die Bediener/in kann die Tabelle nach dieser Spalte sortieren und sieht sortierte leere Seiten oder Seiten mit einem niedrigen Wert für die Erkennungsqualität. So findet der Benutzer leicht problematische Seiten. Dann kann er sie im allgemeinen Paket der Dateien korrigieren.

So hilft der BIQE OCR Server unseren Kunden auf bequeme Weise, die Qualität der Verarbeitung zu kontrollieren und das beste Zielergebnis zu erzielen.

Erkennungsgenauigkeit berechnen

Die Einschätzung der Erkennungsgenauigkeit ist das Kriterium, auf dem die Analyse des Zielergebnisses und damit die endgültige Qualität der Dateiverarbeitung beruht. Deshalb muss die Schätzung der Erkennungsgenauigkeit zuverlässig berechnet werden.

Normalerweise bewerten Erkennungsprogramme die Zuverlässigkeit der Erkennung von Wörtern und einzelnen Zeichen. So auch ABBYY. Der Grad der Erkennungssicherheit hängt in erster Linie von der Qualität des Scans und von einigen anderen Faktoren ab (z. B. der semantischen Analyse).

Der Konfidenzgrad zeigt im Grunde an, wie gut die Erkennungsmaschine das Zeichen oder Wort “erkannt” hat. Dieses Kriterium ist nützlich, um zu beurteilen, wie gut die Erkennungsmaschine darauf trainiert ist, einen bestimmten Text und eine bestimmte Schriftart zu erkennen. Es erlaubt dir aber nicht, die Genauigkeit der Erkennung zu bewerten.

Bei der Erkennung eines minderwertigen Scans zum Beispiel kann das Erkennungsergebnis zwar zu 100 % korrekt und genau sein, aber der Grad des Vertrauens, den die Engine vermittelt, kann sehr niedrig sein. Daher ist dieses Kriterium keine Bewertung der Erkennungsgenauigkeit.

Um die Erkennungsgenauigkeit zu berechnen, verwendet der BIQE OCR-Server einen eigenen komplexen Algorithmus. Dieser Algorithmus berücksichtigt nicht nur den Indikator für die Vertrauensstufe, sondern auch andere Kriterien.

Would you like to learn more?
Please contact us, we are happy to help you!
info@biqe.biz 

Postal address
Meerweg 17
8313 AK Rutten
Netherlands

BIQE OCR Server

  • Unlimited Speed
  • Unlimited MRC PDF compression
  • Fully scalable according to available cores/threads
  • Unique hotfolder processing

BIQE delivers. Unlimited!
Scanning - Optimization - OCR
We are your expert. Ask us!