Skip to main content

Dokumentanalyse mit Hilfe von ATN’s und unscharfen Relationen

  • Conference paper
Mustererkennung 1987

Part of the book series: Informatik-Fachberichte ((INFORMATIK,volume 149))

Zusammenfassung

An der Nahtstelle zwischen papiernen Schriftstücken und Computern werden Papierdokumente in eine elektronische Repräsentation überführt, welche einfache Übertragung, Editierung und effiziente Speicherung ihres Inhalts in Datenbanken gestattet. Über die Sequenz von ASCII-Zeichen hinaus benötigen wir Information über den logischen Aufbau des Schriftstückes. Dazu liefert die vorverarbeitende Segmentierung eine hierarchische Datenstruktur, aus welcher ein Interpretationsmodul eine semantische Beschreibung erzeugt und damit eine eindeutige Zuordnung zwischen Bildobjekten und Modellobjekten. Das Dokumentmodell ist nach Art eines semantischen Netzes aufgebaut. Die Knoten sind durch Teile-von-Relationen und durch unscharf definierte Relationen (fuzzy constraints) verknüpft. In jedem Knoten sind Strategien zur Steuerung der Suche und zur Verifizierung der Relationen vermerkt. ATN-Grammatiken für jeden Modellknoten beschreiben die inhaltliche Struktur der entsprechenden Dokumentteile. Die Analyse erfolgt in zwei Schritten: Zuerst werden mit Hilfe der unscharfen Beziehungen Textblöcke konsistent markiert (consistent labeling). Für jedes markierte Objekt führt dann ein ATN-Parser eine weitere inhaltliche Analyse durch.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 44.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Kreich, J. und Ueberreiter, B.: Interpretation bildhafter Bürodokumente mittels objektorientierter Wissensrepräsentation und hypothesengesteuerter Kontrollstrategien, Informatik-Fachberichte 125, Springer-Verlag, 34–37, 1986.

    Google Scholar 

  2. Dengel, A., Luhn, A., Ueberreiter, B.: Data and Model Representation and Hypothesis Generation in Document Recognition, Proc. 6th Scandinavian Conference on Image Analysis (Stockholm), 57–64, 1987.

    Google Scholar 

  3. Wong, K.Y., Casey, R.G. and Wahl, F.M.: Document Analysis System, IBM J Res. Develop. 26, 647–656, 1982.

    Google Scholar 

  4. Kubota, K., Iwata, O. und Arakawa, H.: Document Understanding System, Proc. 7th Int. Conf. on Pattern Recognition (Montreal), 612–614, 1984.

    Google Scholar 

  5. Meynieux, E., Seisen, S. und Tombre, K.: Bilevel Information Recognition and Coding in Office Paper Documents, Proc. 8th Int. Conf. on Pattern Recognition (Paris), 442–445. 1986.

    Google Scholar 

  6. Higashino, J. et al.: A Knowledge Based Segmentation Method for Document Understanding, Proc. 8th Int. Conf. on Pattern Recognition (Paris), 745–748. 1986.

    Google Scholar 

  7. Information Processing — Text Processing and Interchange — Text Structures Parts 1 to 6 ISO/DIS 8613 (June 1986).

    Google Scholar 

  8. Office Document Architecture,ECMA 101 (September 1985).

    Google Scholar 

  9. Message Handling Systems: Presentation Transfer Syntax and Notation,CCITT recommendation X.409.

    Google Scholar 

  10. Scherl, W.: Unified Analysis of Complex Document Patterns, Proc. 4th Scandinavian Conference on Image Analysis (Trondheim) 1985.

    Google Scholar 

  11. Bernhardt, L.: Three Classical Character Recognition Problems, Three New Solutions, Siemens Research and Development Reports 13, 114–117, 1984.

    Google Scholar 

  12. Kuner, P. und Ueberreiter, B.: Knowledge-Based Pattern Recognition in Disturbed Line Images Using Graph Theory, Optimization, and Predicate Calculus, Proc. 8th Int. Conf. on Pattern Recognition (Paris), 240–243. 1986.

    Google Scholar 

  13. Egeli, E., Klein, F. und Maderlechner, G.: Model-Based Instantiation of Symbols from Structurally Related Image Primitives, Proc. SPIE Image Processing (Cannes), 1985.

    Google Scholar 

  14. Ballard, D.H. und Brown, C.M.: Computer Vision, Prentice Hall, 1982.

    Google Scholar 

  15. Charniak, E. und McDermott, D.: Introduction to Artificial Intelligence, Addison-Wesley, 1985.

    Google Scholar 

  16. Scheller, A.: Decentralized Processing of Documents, Computers and Graphic, Vol 10, No. 2, 1986.

    Google Scholar 

  17. Wong, C.-H. und Srihari, S.N.: Object Recognition in Structured and Random Environments: Locating Address Blocks on Mail Pieces, Proc. of AAAI, 1986.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1987 Springer-Verlag Berlin Heidelberg

About this paper

Cite this paper

Bergengruen, O., Luhn, A., Maderlechner, G., Ueberreiter, B. (1987). Dokumentanalyse mit Hilfe von ATN’s und unscharfen Relationen. In: Paulus, E. (eds) Mustererkennung 1987. Informatik-Fachberichte, vol 149. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-22205-8_18

Download citation

  • DOI: https://doi.org/10.1007/978-3-662-22205-8_18

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-18375-4

  • Online ISBN: 978-3-662-22205-8

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics