Zusammenfassung
Um relevante Informationen aus der unüberschaubaren heutigen Datenwelt (Big Data) zu identifizieren, genügen heutige Suchmaschinen nicht mehr, wenn bloß nach eingegebenen Stichwörtern (Zeichenketten) in Textinhalten gesucht werden kann. Vielmehr müssen diese fähig sein nach Instanzen von Konzepten einer Ontologie zu suchen, also nach Repräsentationen der zugrunde liegenden Begriffe und derer Zusammenhänge. Durch die Verknüpfungen von Entitäten untereinander werden komplexere Abfragen möglich, da die Inhalte, in denen gesucht wird, thematisch kategorisiert werden können. Vor diesem Hintergrund haben sich viele Berufsbilder in den letzten Jahren sehr verändert und komplett neue sind hinzugekommen. In der Arbeitsforschung hat sich der neue Begriff des Information Workers bzw. Knowledge Workers herausgebildet. Für diese Infor mation Workers ist es wichtig mit thematischen Suchtechnologien, große Mengen von Dokumenten schnell zu finden und geschäftskritische Informationen aus ihnen zu extrahieren. Journalisten, Bibliothekare, Banker, Wirtschaftsprüfer, Ärzte, Wissenschaftler, Kundenbetreuer u.v.m. werden vermehrt auf Werkzeuge, die diese Technologien einsetzen, angewiesen sein. Mit dem Produkt Find-it der Canoo Engineering AG wird ein Anwendungsfall in einem Redaktionssystem gezeigt.
Überarbeiteter Beitrag basierend auf „Wie man mit der Wikipedia semantische Verfahren verbessern kann“. In: HMD – Praxis der Wirtschaftsinformatik, HMD-Heft Nr. 271, 48 (1): 70–80, 2010.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Weitere Information zur Firmen- und Produktbeschreibung unter http://findit.canoo.com/
- 2.
Die Munzinger-Archiv GmbH ist ein deutscher Verlag und Online-Informationsanbieter mit Sitz in Ravensburg http://www.munzinger.de/
- 3.
- 4.
- 5.
- 6.
Ist eine Sammlung von Texten oder Äußerungen in einer Sprache.
- 7.
- 8.
- 9.
Das Projekt findet sich unter http://sourceforge.net/projects/wikipedia-miner/
- 10.
Die Wikipedia ist in vielen Sprachen verfügbar (http://de.wikipedia.org/wiki/Wikipedia:Sprachen).
- 11.
Weitere Infos zum Redaktionssystem http://www.red-web.com/
- 12.
Damit ist es möglich Dokumente automatisch mit der entsprechenden Biographie aus dem Munzinger-Archiv zu verlinken https://www.munzinger.de/
- 13.
- 14.
- 15.
Literatur
Ankolekar, A., Krötzsch, M., Tran, T., Vrandecic, D.: The two cultures: mashing up Web 2.0 and the semantic web. In: 16th International World Wide Web Conference (WWW 2007). Banff, Alberta, (S. 825–834). Curran, Red Hook (2007)
Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval. 2. Aufl. Addison-Wesley/ACM Press, New York (2011)
Blumauer, A., Pellegrini, T. (Hrsg.): Social Semantic Web: Web 2.0 – Was nun? Springer, Berlin (2008)
Bojars, U., Breslin, J.G., Finn, A., Decker, S.: Using the semantic web for linking and reusing data across Web 2.0 communities. J. Web Semant. 6(1), 21–28 (2008)
Buffa, M., Gandon, F.L., Sander, P., Faron, C., Ereto, G.: SweetWiki. J. Web Semant. 6(1), 84–97 (2008)
Bunescu, R., Pasca, M.: Using encyclopedic knowledge for named entity disambiguation. In: Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (EACL-06), Trento (2006)
Cucerzan, S. Large-scale named entity disambiguation based on Wikipedia data. In: Proceedings of Empirical Methods in Natural Language Processing (EMNLP 2007), Prague (2007)
Dengel, A.: Semantische Technologien: Grundlagen. Konzepte. Anwendungen. Spektrum Akademischer Verlag, Heidelberg (2012). ISBN 9783827426635
Finkelstein, L., Gabrilovich, Y.M., Rivlin, E., Solan, Z., Wolfman, G., Ruppin, E.: Placing search in context: the concept revisited. ACM Trans. Inf. Syst. 20(1), 406–414 (2002)
Gabrilovich, E., Markovitch, S.: Overcoming the brittleness bottleneck using Wikipedia: Enhancing text categorization with encyclopedic knowledge. In: Proceedings of the Twenty-First National Conference on Artificial Intelligence, Boston (2006)
Gabrilovich, E., Markovich, S.: Computing semantic relatedness using Wikipedia-based explicit semantic analysis. In: Proceedings of the 20th International Joint Conference on Artificial Intelligence (IJCAI’07), Hyderabad (2007)
Hotho, A., Hoser, B. (Hrsg.): Bridging the Gap between Semantic Web and Web 2.0: Workshop located at the European Semantic Web Conference (ESWC 2007). Innsbruck, Austria. Retrieved 13 Nov 2008, from http://www.kde.cs.uni-kassel.de/ws/eswc2007/program.html (2007). Zgegriffen am 24.05.2016
Karttunen, I.: Constructing lexical transducers. In: The Proceedings of the 15th International Conference on Computational Linguistics. Coling 94, Bd. I, S. 406–411. Kyoto (1994)
Koskenniemi, K.: Two-level morphology. A general computational model for word-form recognition and production. Department of General Linguistics, University of Helsinki (1983)
Lange, C., Schaffert, S., Skal-Molli, H., Völkel, M. (Hrsg.): The Wiki Way of Semantics. In: Proceedings of the 3rd Semantic Wiki Workshop (SemWiki 2008) at the 5th European Semantic Web Conference (ESWC 2008), Tenerife. CEUR Workshop Proceedings, Bd. 360 (2008)
Milne, D., Witten, I.H.: Learning to link with Wikipedia. In: Proceedings of the ACM Conference on Information and Knowledge Management (CIKM’2008), Napa Valley (2008)
Milne, D., Witten, I.H.: An open-Source toolkit for mining Wikipedia. https://github.com/dnmilne/wikipediaminer (2009) . Zgegriffen am 24.05.2016
Pohl, A.: Improving the Wikipedia miner word sense disambiguation algorithm. In: Proceedings of Federated Conference on Computer Science and Information Systems 2012, S. 241–248, Wroclaw 9–12 Sept 2012, ISBN:978-83-60810-51-4
Salton, G., McGill, M.J.: Introduction to Modern Information Retrieval. McGraw-Hill, New York (1983). ISBN 0070544840
Zesch, T., Müller, C., Gurevych, I.: Extracting lexical semantic knowledge from Wikipedia and Wiktionary. In: Proceedings of the 6th International Conference on Language Resources and Evaluation (LREC 2008) S. 1646–1652, Paris (2008)
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2016 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Hengartner, U. (2016). Semantische Suchverfahren in der Welt von Big Data. In: Fasel, D., Meier, A. (eds) Big Data. Edition HMD. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-11589-0_13
Download citation
DOI: https://doi.org/10.1007/978-3-658-11589-0_13
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-11588-3
Online ISBN: 978-3-658-11589-0
eBook Packages: Computer Science and Engineering (German Language)