Zusammenfassung
An der Nahtstelle zwischen papiernen Schriftstücken und Computern werden Papierdokumente in eine elektronische Repräsentation überführt, welche einfache Übertragung, Editierung und effiziente Speicherung ihres Inhalts in Datenbanken gestattet. Über die Sequenz von ASCII-Zeichen hinaus benötigen wir Information über den logischen Aufbau des Schriftstückes. Dazu liefert die vorverarbeitende Segmentierung eine hierarchische Datenstruktur, aus welcher ein Interpretationsmodul eine semantische Beschreibung erzeugt und damit eine eindeutige Zuordnung zwischen Bildobjekten und Modellobjekten. Das Dokumentmodell ist nach Art eines semantischen Netzes aufgebaut. Die Knoten sind durch Teile-von-Relationen und durch unscharf definierte Relationen (fuzzy constraints) verknüpft. In jedem Knoten sind Strategien zur Steuerung der Suche und zur Verifizierung der Relationen vermerkt. ATN-Grammatiken für jeden Modellknoten beschreiben die inhaltliche Struktur der entsprechenden Dokumentteile. Die Analyse erfolgt in zwei Schritten: Zuerst werden mit Hilfe der unscharfen Beziehungen Textblöcke konsistent markiert (consistent labeling). Für jedes markierte Objekt führt dann ein ATN-Parser eine weitere inhaltliche Analyse durch.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Kreich, J. und Ueberreiter, B.: Interpretation bildhafter Bürodokumente mittels objektorientierter Wissensrepräsentation und hypothesengesteuerter Kontrollstrategien, Informatik-Fachberichte 125, Springer-Verlag, 34–37, 1986.
Dengel, A., Luhn, A., Ueberreiter, B.: Data and Model Representation and Hypothesis Generation in Document Recognition, Proc. 6th Scandinavian Conference on Image Analysis (Stockholm), 57–64, 1987.
Wong, K.Y., Casey, R.G. and Wahl, F.M.: Document Analysis System, IBM J Res. Develop. 26, 647–656, 1982.
Kubota, K., Iwata, O. und Arakawa, H.: Document Understanding System, Proc. 7th Int. Conf. on Pattern Recognition (Montreal), 612–614, 1984.
Meynieux, E., Seisen, S. und Tombre, K.: Bilevel Information Recognition and Coding in Office Paper Documents, Proc. 8th Int. Conf. on Pattern Recognition (Paris), 442–445. 1986.
Higashino, J. et al.: A Knowledge Based Segmentation Method for Document Understanding, Proc. 8th Int. Conf. on Pattern Recognition (Paris), 745–748. 1986.
Information Processing — Text Processing and Interchange — Text Structures Parts 1 to 6 ISO/DIS 8613 (June 1986).
Office Document Architecture,ECMA 101 (September 1985).
Message Handling Systems: Presentation Transfer Syntax and Notation,CCITT recommendation X.409.
Scherl, W.: Unified Analysis of Complex Document Patterns, Proc. 4th Scandinavian Conference on Image Analysis (Trondheim) 1985.
Bernhardt, L.: Three Classical Character Recognition Problems, Three New Solutions, Siemens Research and Development Reports 13, 114–117, 1984.
Kuner, P. und Ueberreiter, B.: Knowledge-Based Pattern Recognition in Disturbed Line Images Using Graph Theory, Optimization, and Predicate Calculus, Proc. 8th Int. Conf. on Pattern Recognition (Paris), 240–243. 1986.
Egeli, E., Klein, F. und Maderlechner, G.: Model-Based Instantiation of Symbols from Structurally Related Image Primitives, Proc. SPIE Image Processing (Cannes), 1985.
Ballard, D.H. und Brown, C.M.: Computer Vision, Prentice Hall, 1982.
Charniak, E. und McDermott, D.: Introduction to Artificial Intelligence, Addison-Wesley, 1985.
Scheller, A.: Decentralized Processing of Documents, Computers and Graphic, Vol 10, No. 2, 1986.
Wong, C.-H. und Srihari, S.N.: Object Recognition in Structured and Random Environments: Locating Address Blocks on Mail Pieces, Proc. of AAAI, 1986.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1987 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Bergengruen, O., Luhn, A., Maderlechner, G., Ueberreiter, B. (1987). Dokumentanalyse mit Hilfe von ATN’s und unscharfen Relationen. In: Paulus, E. (eds) Mustererkennung 1987. Informatik-Fachberichte, vol 149. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-22205-8_18
Download citation
DOI: https://doi.org/10.1007/978-3-662-22205-8_18
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-18375-4
Online ISBN: 978-3-662-22205-8
eBook Packages: Springer Book Archive