Reading PDF417 from Color Image
PDF417-Lesung ab Farbbild
Jeder kennt das Piepen der Supermarktkassen wenn ein Strichcode erkannt wurde. Und wohl jeder leidet ein wenig mit der Kassiererin mit, wenn diese den Code unter Zeitdruck von Hand eintippen muss. Trotz optimierter Technik bei Laserscannern und eindimensionalen Barcodes können nicht alle Barcodes maschinell gelesen werden.
So ähnlich ist das auch beim Scannen von Steuerdokumenten. Nur komplexer. Die vom Steuerpflichtigen am Computer erstellte Steuererklärung erhält beim Ausdrucken ein Barcode- oder Unterschriftenblatt, das die Daten codiert in kompaktmöglichster Form enthält: Die Rede ist vom zweidimensionalen Barcode vom Typ PDF417. Wesentlich vielfältiger als im Supermarkt ist nun aber der Weg von der Erzeugung bis zur Verarbeitung. Faktoren wie die Art der Codierung, die Gestaltung des Barcodes, die Wahl des Papiers (weiss oder Recyclingpapier), die Skalierung beim Ausdrucken, Füllstand von Tinte oder Toner, die Behandlung des Papiers beim Verpacken und Verarbeiten sowie die Bauweise des Scanners beeinflussen die Qualität der Leseergebnisse massgeblich.
Sind alle Hürden der Bilderzeugung genommen, ist dennoch noch kein Barcode erkannt. Die sogenannte Barcode-Engine versucht auf dem als Barcode-Blatt deklarierten Bild Barcode-Elemente zu finden, gegebenenfalls zu rotieren und zu lesen und leitet den Inhalt der Codes weiter. Nicht jede Barcode-Engine kann dies gleich gut. Je besser eine Engine fehlende, verschmierte, verzerrte, unscharfe oder undeutliche Partien ignorieren kann, desto eher kann sie dem Bild den Code entlocken.
Die Engine versucht im Detail herauszufinden, ob ein Bildpunkt (ein Pixel) schwarz oder weiss ist und wo dieser Bildpunkt im Kontext des Barcodes zu positionieren ist. Darüber hinaus greifen Algorithmen, die diese Interpretationen gegeneinander abwägen und korrigieren. Liegt das gescannte Bild in schwarzweiss vor, hat die Engine wenig Möglichkeiten ihre Algorithmen nutzen zu können. Auf einem farbig gescannten Bild entstehen an den Grenzen zwischen Schwarz und Weiss graue Abstufungen. Und eben diese Grauabstufungen können von qualifizierten Engines als zusätzliche Information für die Interpretation genutzt werden.
Interact Consulting nutzt diesen Vorteil in der Lösung CaptureTax und verbindet ihn mit bestehenden Mitteln zu einem mehrstufigen Verfahren: Klassifikation der Bilder, dezidierte Lesung der Barcodes ab Schwarzweiss- und ab Farbbild und Interpretation der Ergebnisse.
Mit Erfolg. Die Scann-Center, die die CaptureTax-Option Lesung der Barcodes ab Farbbild aktiviert haben, erfreuen sich einer höheren Erkennungsrate und damit verbunden an geringeren Verarbeitungskosten.
Konkret: Lag die Erkennungsrate in diesen Scann-Centern im ersten Trimester des Jahres 2009 bei zirka 75 Prozent, so befindet sich die durchschnittliche Erkennungsrate heute bei 90 Prozent. Das sind bei insgesamt rund 330 000 Tax-Steuererklärungen, die diese Scann-Center pro Jahr verarbeiten, rund 50 000 Erklärungen zusätzlich, die von CaptureTax ohne manuellen Eingriff vollautomatisch, zuverlässig und rasch verarbeitet werden.
Sie haben Fragen? Kontaktieren Sie noch heute unsere Spezialisten.
back to the overview 