OCR Texterkennung
Die OCR-Texterkennung ermöglicht es, gedruckte und handschriftliche Dokumente schnell und kostengünstig in digitale Dokumente umzuwandeln. Beispielsweise Geschäftsbriefe, Rechnungen, Lieferscheine, Broschüren oder Bücher. Die digitalisierten Dokumente können durchsucht, bearbeitet und platzsparend archiviert werden. Wie die OCR Texterkennung funktioniert, welche Vorteile sie bietet und welche Software empfehlenswert ist, erfahren Sie im folgenden Beitrag.
OCR Texterkennung - Die wichtigsten Fragen
Bei der OCR Texterkennung werden die Buchstaben und Ziffern eines gescannten Dokuments von analysiert und die erkannten Muster mit gespeicherten Daten verglichen.
Empfehlenswerte OCR Software Programme für den PC sind ReadIris, Abbyy Fine Reader und OmniPage Ultimate.
Je nach Software, Schriftart, Qualität des Dokuments und Qualität des Scans beträgt die Erkennungsrate zwischen 50 und 100 %.
Intelligente OCR Software kann mithilfe künstlicher Intelligenz und neuronaler Netze lernen, Handschriften zu erkennen.
OCR-Texterkennung: Erklärung
OCR ist die Abkürzung von „Optical Character Recognition“ (Optische Zeichenerkennung). OCR wird allgemein auch als automatische Text- oder Zeichenerkennung bezeichnet. Mithilfe von OCR-Software können die Inhalte gedruckter oder handschriftlicher Dokumente nach dem Einscannen in maschinenlesbare Zeichen umgewandelt werden. Nach der Umwandlung können diese Dokumente wie andere an einem Computer erstellte Texte durchsucht und bearbeitet werden. Die Wurzeln der OCR-Texterkennung reichen zurück in die Zeit der Telegrafie.
Kurz vor dem Ersten Weltkriegs erfand der in Moskau geborene Physiker und Chemiker Emanuel Goldberg eine Maschine, die Zeichen lesen und in einen Telegrafencode umwandeln konnte. In den 1920er-Jahren entwickelt er eine Maschine, die mit einer Fotozelle und einem Projektor Schriftzeichen identifizieren konnte.
Seitdem wurde die OCR Texterkennung immer weiter verbessert. Unternehmen nutzen diese Technologie, um den Aufwand für die Konvertierung und Extraktion von Daten aus Papierdokumenten zu reduzieren. Frühe Versionen der OCR Texterkennung mussten mit Bildern jedes Zeichens trainiert werden und waren darauf beschränkt, jeweils eine Schriftart zu erkennen. In den 1970er-Jahren kommerzialisierte der Erfinder Ray Kurzweil die „Omni-Font-OCR“, die Text in nahezu jeder Schriftart verarbeiten konnte. In den frühen 2000er-Jahren wurde die OCR Texterkennung dann als Cloud-basierter Dienst online verfügbar, der über Desktop- und mobile Anwendungen zugänglich ist.
Welche Technologie steckt hinter der OCR-Texterkennung?
Bei der OCR-Texterkennung werden zwei verschiedene Techniken für die Zeichenerkennung angewendet. Diese sind die
- Mustererkennung
- Merkmalsextraktion
OCR Texterkennung mithilfe der Mustererkennung
Bei der Mustererkennung versucht die Software ganze Zeichen zu erkennen und mit einer in der Software gespeicherten Zeichenmatrix abzugleichen. Eine andere Bezeichnung für diese Technik ist daher auch Matrixabgleich. Der Nachteil dieser Technik besteht darin, dass die erkannten Zeichen und die gespeicherten Zeichen dieselbe Schriftart und denselben Maßstab haben müssen. Softwareprogramme für die OCR Texterkennung, welche die Mustererkennung nutzen, sind in der Regel darauf programmiert, die Zeichen häufig verwendeter Schriftarten wie Times New Roman, Courier, Arial oder Verdana zu erkennen. Für handschriftliche Dokumente eignet sich diese Technik nicht.
OCR Texterkennung mithilfe der Merkmalextraktion
Die Merkmalextraktion oder Merkmalerkennung ist eine ausgefeiltere Technik zum Erkennen einzelner Zeichen. Bei dieser Methode wird jedes Zeichen in einzelne Bestandteile wie beispielsweise Linien, Linienrichtungen, geschlossene Schleifen und Schnittpunkte von Linien aufgeteilt. Erkennt die Software beispielsweise zwei einander zugeneigte Linien, die sich am oberen Ende berühren und befindet sich zwischen den beiden Linien noch eine horizontale Linie, dann handelt es sich aller Wahrscheinlichkeit nach um den Buchstaben A. Diese Technik wird auch als Intelligent Character Recognition abgekürzt ICR oder Feature Extraction bezeichnet. Bei dieser Technik kommen auch spezielle Algorithmen wie der Nearest-Neighbors-Algorithmus zur Anwendung. Mithilfe dieses Algorithmus werden die extrahierten Bildmerkmale mit gespeicherten Merkmalen verglichen, sodass die beste Übereinstimmung ausgewählt werden kann. Beispielsweise ob es sich bei einem Zeichen um ein „I“ oder eine „1“ handelt.
OCR-Texterkennung: Vorteile
Die wesentlichen Vorteile der OCR Texterkennung sind:
Kostenreduzierung – mithilfe der OCR-Texterkennung können Daten kostengünstig extrahiert werden
Fehlervermeidung – gegenüber der manuellen Eingabe von Daten ist die Fehlerquote bei der OCR-Texterkennung gering
Platzersparnis – die elektronisch gespeicherten Daten benötigen wesentlich weniger Platz als Papierdokumente.
Hohe Datensicherheit – elektronisch gespeicherte Dokumente können besser gegen Datendiebstahl und unbefugte Einsicht geschützt werden als Papierdokumente.
100 % durchsuchbare Dokumente – mithilfe der OCR Texterkennung können gedruckte und handschriftliche Dokumente wie andere digitale Dokumente nach beliebigen Parameter durchsucht werden.
Disaster Recovery – die Datenspeicherung digitalisierter Dokumente auf sicheren Servern und verteilten Systemen ermöglicht nach Notfallsituationen eine unterbrechungsfreie Fortführung des Geschäftsbetriebes.
Vorgehensweise bei der OCR-Texterkennung: Schritt für Schritt
Ausgangspunkt für die OCR Texterkennung ist ein Bild des gescannten Dokumentes. Die Texterkennungschritte sind:
Preprocessing
Beim Preprocessing werden verschiedene Techniken eingesetzt, um die Erkennungsrate zu verbessern. Hierzu gehören:
- De-Skew – Ausrichten des Dokumentes horizontal oder vertikal
- Despeckle – Entfernen von Flecken und Glätten von Kanten.
- Binarisierung – Umwandeln des Bildes in ein schwarz-weiß Bild. Dadurch kann der Text vom Hintergrund getrennt und die Erkennungsrate erhöht werden.
- Zeilenentfernung – entfernt Linien und Felder die keine Textzeichen enthalten
- Layoutanalyse oder „Zoning“ – identifizieren von Spalten, Absätze und Beschriftungen als eindeutige Blöcke. Dieser Vorgang ist insbesondere bei mehrspaltigen Layouts und bei Tabellen wichtig.
- Linien- und Worterkennung – legt die Grundlinie für Wort- und Zeichenformen fest und trennt Wörter bei Bedarf.
- Zeichenisolation oder „Segmentierung“ – Trennen von Zeichen, die durch Bildartefakte verbunden zu sein scheinen und zusammenfügen von Zeichen, die durch Bildartefakte getrennt sind.
- Seitenverhältnis und Skalierung normalisieren
- Bei diesem Prozess werden die Schriftarten beispielsweise an einem einheitlichen Raster ausgerichtet, sodass die Software Leerräume zwischen Buchstaben und Wörtern unterscheiden kann.
Texterkennung
Nach dem Preprocessing erfolgt die eigentliche Texterkennung anhand eines der beiden weiter oben beschriebenen Verfahren.
Postprocessing
Im Rahmen des Postprocessings werden mithilfe spezieller Algorithmen mögliche Fehler bei der Texterkennung analysiert und behoben. Schließlich wird das Dokument in das gewünschte Ausgabeformat konvertiert.
Welche Software, Apps und Tools können Sie für die OCR-Texterkennung nutzen?
In den 1980er-Jahren wurden für die OCR Texterkennung noch Großrechner benötigt. Heute sind selbst Smartphones und Tablets leistungsstark genug, um Dokumente zu scannen und zu digitalisieren. Die wichtigsten Softwareprogramme und Tools für die OCR-Texterkennung sind:
OCR-Software für PC
Name | Betriebssystem | Besonderheiten |
OmniPage Ultimate | Windows & MacOS | Bearbeiten von Bildern (BMP, JPG, GIF, PNG und andere) |
Readiris 17 | Windows & MacOS | PDF-Erstellung und Bearbeitung |
Abbyy Fine Reader | Windows & MacOS | PDF erstellen und bearbeiten |
Prizmo 2 | MacOS | Verwaltungssoftware für Dokumente mit OCR Texterkennung |
OCR Text Detection Tool | Windows | erkennt Texte in Bildern und Webcam-Aufnahmen |
OCR-Software für Smartphone und Tablet
Name | Betriebssystem | Besonderheiten |
scan me | iPhone-App | Dokumentenscanner mit Anbindung an Dropbox, Google Drive und Organize.me |
Adobe Scan | Android App | speichert Dokumente mit automatischer Texterkennung |
Microsoft Lens | Android App | Scanner für Dokumente, Poster oder Notizen |
TextGrabber | iPhone- / iPad-App | Übersetzer-App mit OCR-Erkennung |
OCR-Texterkennung Online-Tools
Name | Besonderheiten |
ABBYY Cloud OCR SDK | extrahiert Textinformationen aus Scans, PDFs, Dokumentbildern, Smartphone-Fotos oder Screenshots |
Google Vision API | extrahiert Textinformationen aus Bildern und Dokumenten |
Amazon Textract | Machine-Learning-Service von AWS für gedruckte und handschriftliche Texte |
Zusammenfassung
OCR-Texterkennung ist eine ausgereifte Technik für die Digitalisierung gedruckter und handschriftliche Dokumente. Immer mehr Unternehmen nutzen diese Technik, um Dokumente durchsuchbar zu machen, sicher und platzsparend zu archivieren. OCR-Software kann auf PCs, Smartphones und Tablets eingesetzt werden. Für die Digitalisierung vieler Dokumente empfiehlt sich die Beauftragung eines spezialisierten Dienstleisters.
Leave a comment