Texte erkennen, aber richtig – der PDF-Mapper? der ExxTainer AG versteht PDF-Belege und verwandelt sie mit der hinterlegten Semantik in strukturierte, maschinenlesbare Daten

?Texte erkennen können viele Tools, wirklich verstehen jedoch nur wenige?, sagt? Dr. Werner Simon von der ExxTainer AG. Für gewerbliche Anwender in Industrie und Handel wie auch für komplexe Verwaltungsabläufe ist es jedoch wichtig, dass Daten und Informationen semantisch ? also in ihrer jeweiligen logischen Bedeutung ?? ausgelesen und zugeordnet werden können.

Der PDF-Mapper? der ExxTainer AG konvertiert PDF-Belege nach EDI/XML und verwendet dabei die Positionsinformation der Texte (x, y, dx, dy) zur semantischen Zuordnung der Wordbedeutung im Beleg. Er erfasst diese Texte einschließlich zugehöriger Positionsinformationen, um daraus strukturierte Daten für die automatische Übernahme in die Inhousesysteme zu erstellen. So liest er komplex aufgebaute Belege mit Tabellen aus vielen Positionen (auch mit verschiedenen Inhalten pro Position), ausführlichen Texten und Beschreibungen, unterschiedlichen Artikelnummern, verschiedenen Lieferzeitwünschen pro Position etc. vollständig fehlerfrei aus.

Viele Tools ? keine Lösung

Auf dem Markt gibt es eine Vielzahl an Tools für die Umwandlung von PDF in durchsuchbare Formate wie .doc, .odt, .csv. .jpg, ? aber nur ganz wenige, die PDF präzise, verlässlich und zu 100 % vollständig in XML oder EDIFACT wandeln können. Also in strukturierte, maschinenlesbare Daten, die von den verschiedensten Inhousesystemen, wie einer Buchungssoftware, einer Warenwirtschaft, einem Kommissionierungstool, einer ERP- oder einer Verwaltungssoftware automatisch weiterverarbeitet werden können.

Das Problem bei einfachen Tools: Entweder lesen diese Tools nur den Text (wie in eine Textdatei) aus, d. h. ohne Positionsinformation etc. oder erzeugen zwar auslesbares und durchsuchbares PDF,? aber ohne semantische Zuordnung der Inhalte. Also bei Bestellungen beispielsweise ist nicht erkennbar, was eine Bestellmenge, was ein Artikelpreis und was eine Bestellnummer ist. Alles Informationen, die für die weitere Verarbeitung benötigt werden.

PDF-Mapper? ? mit Semantik zum Textverständnis

Im gewerblichen Bereich in Industrie und Handel müssen Bestell-, Liefer- und Rechnungsinformationen semantisch ausgelesen werden können. Für Verwaltungen und Behörden sind Namens, Adressdaten, Paragraphentexte und Ausführungsbestimmungen sowie Fristen wichtig.

Semantisch bedeutet, dass nicht nur der reine Text erkannt werden muss, sondern auch die Bedeutung des Textes. Bei einer Ziffernfolge wie einem Datum muss erkannt werden, ob es sich dabei um ein Lieferdatum oder eine Zahlungsfrist handelt.?

Mit dem PDF-Mapper? sind eingehende Belege im Stapelbetrieb erfassbar, können vollautomatisch zugeordnet und zu 100 % vollständig, fehlerfrei und erkennungssicher ausgelesen werden für eine reibungslose Übernahme in Buchhaltung, Warenwirtschaft, Logistiktool, Verwaltungssoftware oder ERP.

Features und Vorteile des PDF-Mappers? im Überblick

PDF wird in maschinenlesbare Daten konvertiert

Verarbeitung beliebiger Beleg-Layouts

Verarbeitung komplexer Belege mit vielen Artikelpositionen, Untertabellen pro Position, mehrzeiligen Belegnummern etc. ? nicht nur Kopf- und Fußteil eines Belegs werden erfasst

keine manuellen Eingaben notwendig ? keine Erfassungsfehler, kein Zeitverlust, kein Nachbearbeiten

volle Integration in die digitale Unternehmenswelt

keine Abstimmungsprobleme mit dem Belegabsender ? er schickt was er hat wie bisher

Das kostenlose “E-Book – Digitaler Belegfluss fu?r PDF-Belege” beschreibt ausführlich, wie die Konvertierung von PDF nach XML funktioniert und wie Unternehmen davon profitieren. Hier ist es erhältlich: https://t1p.de/560t