Zusammenfassung
Methoden und Techniken zur automatischen Verarbeitung und inhaltlichen Erfassung großer Mengen an Textdokumenten haben in den vergangenen Jahren enorm an Bedeutung gewonnen. Während einerseits die Verfügbarkeit und der Zugang zu digitalisierten Textdokumenten bis dato in ungeahntem Maße gestiegen sind, erweist sich die Erfassung des semantischen Inhalts solcher Dokumentsammlungen als problematisch. Dem expandierenden Forschungsfeld der visuellen Textanalyse und Textvisualisierung kommt dabei eine Schlüsselrolle bei der Lösung von Problemstellungen aus der Praxis zu. Anhand aktueller Anwendungsbeispiele und einem Überblick über den Stand der Forschung erläutert dieser Artikel die vielfältigen Möglichkeiten, die sich durch visuelle Textanalyse ergeben.
References
Allan J (2002) Introduction to topic detection and tracking. Kluwer Academic Publishers, Norwell, MA, pp 1–16
de Saussure F (2001) Grundfragen der allgemeinen Sprachwissenschaft. Walter de Gruyter
European Patent Office (2010) Patent information products and services, “products_services_en.pdf”. http://www.epo.org/about-us/publications/patent-information/products-services.html, letzter Zugriff 17.9.2010
Feldman R, Sanger J (2007) The Text Mining Handbook. Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press
Han J, Kamber M (2006) Data Mining: Concepts and techniques, 2nd edn. Morgan Kaufmann, San Francisco, CA
Havre S, Hetzler B, Nowell L (2000) ThemeRiver: Visualizing Theme Changes over Time. In: Proceedings of the IEEE Symposium on Information Visualization 2000, pp 115f.
Holz F, Teresniak S (2010) Towards automatic detection and tracking of topic change. In:. Gelbukh A (ed) Proc. CICLing 2010, Iasi: Conference on Intelligent Text Processing and Computational Linguistics, LNCS 6008. Springer LNCS
Jurafsky D, Martin JH (2009) Speech and language processing. An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd edn. Prentice Hall Series in Artificial Intelligence
Keim DA, Mansmann F, Oelke D, Ziegler H (2008) Visual analytics. Combining automated discovery with interactive visualizations. In: Boulicaut J-F, Berthold MR, Horváth T (eds) Discovery Science, 11th International Conference, DS 2008, Budapest, Hungary, October 13–16, 2008. Proceedings Lect Notes Artif Intell, vol 5255, pp 2–14. Springer, Heidelberg
Keim DA, Oelke D, Rohrdantz C (2010) Analyzing Document Collections via Context-Aware Term Extraction. In: 14th International Conference on Applications of Natural Language to Information Systems (NLDB ’09). Lect Notes Comp Sci 5723, pp 154–168. Springer, Heidelberg
Koch S, Bosch H, Giereth M, Ertl T (2010) Iterative integration of visual insights during scalable patent search and analysis. Vis Comp Graph, IEEE Transactions, vol 99
Landauer TK, McNamara DS, Dennis SJ, Kintsch W (2007) Handbook of latent semantic analysis. Erlbaum, Mahwah, NJ
Manning CD, Prabhakar R, Schütze H (2008) Introduction to Information Retrieval. Cambridge University Press
Oelke D, Hao M, Rohrdantz C, Keim DA, Dayal U, Haug L, Janetzko H (2009) Visual opinion analysis of customer feedback data. In: Proc IEEE Symp Vis Anal Sci Technol (VAST ’09), pp 187–194
Oesterling P, Heine C, Jaenicke H, Scheuermann G (2010) Visual analysis of high dimensional point clouds using topological landscapes. In: North S, Shen H-W, van Wijk JJ, (eds) IEEE Pacific Visualization 2010 Symposium Proceedings, pp 113–120
Shneiderman B (1996) The eyes have it: a task by data type taxonomy for information visualizations. Technical Report UMCP-CSD CS-TR-3665, College Park, Maryland
Soboroff I, Harman D (2005) Novelty detection: the TREC experience. In: HLT/EMNLP, pp 105–112
Teresniak S, Heyer G, Scheuermann G, Holz F (2009) Visualisierung von Bedeutungsverschiebungen in großen diachronen Dokumentkollektionen. Datenbank-Spektrum 31:33–39
Wanner F, Rohrdantz C, Mansmann F, Oelke D, Keim DA (2009) Visual Sentiment Analysis of RSS News Feeds featuring the US Presidental Election in 2008. In: Proceedings of the IUI’09 Workshop on Visual Interfaces to the Social and the Semantic Web (VISSW 2009). http://ceur-ws.org/Vol-443/paper7.pdf, letzter Zugriff 17.9.2010
Wanner L, Baeza-Yates R, Brügmann S, Codina J, Diallo B, Escorsa E, Giereth M, Kompatsiaris Y, Papadopoulos S, Pianta E, Piella G, Puhlmann I, Rao G, Rotard M, Schoester P, Serafini L, Zervaki V (2008) Towards content-oriented patent document processing. World Pat Inf 30(1):21–33
World Intellectual Property Organization (2009) World Intellectual Property Indicators. http://www.wipo.int/export/sites/www/ipstats/en/statistics/patents/pdf/wipo_pub_941.pdf, letzter Zugriff 17.9.2010
World Intellectual Property Organization (2010) International Patent Classification (IPC). http://www.wipo.int/classifications/ipc/en/, letzter Zugriff 17.9.2010
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Rohrdantz, C., Koch, S., Jochim, C. et al. Visuelle Textanalyse. Informatik Spektrum 33, 601–611 (2010). https://doi.org/10.1007/s00287-010-0483-x
Published:
Issue Date:
DOI: https://doi.org/10.1007/s00287-010-0483-x