Skip to main content

Semantische Suchverfahren in der Welt von Big Data

Semantische Suchverfahren – Automatisierte Kategorisierung und Erhöhung der Relevanz bei der thematischen Suche in Big Data

  • Chapter
  • First Online:
Big Data

Part of the book series: Edition HMD ((EHMD))

  • 42k Accesses

Zusammenfassung

Um relevante Informationen aus der unüberschaubaren heutigen Datenwelt (Big Data) zu identifizieren, genügen heutige Suchmaschinen nicht mehr, wenn bloß nach eingegebenen Stichwörtern (Zeichenketten) in Textinhalten gesucht werden kann. Vielmehr müssen diese fähig sein nach Instanzen von Konzepten einer Ontologie zu suchen, also nach Repräsentationen der zugrunde liegenden Begriffe und derer Zusammenhänge. Durch die Verknüpfungen von Entitäten untereinander werden komplexere Abfragen möglich, da die Inhalte, in denen gesucht wird, thematisch kategorisiert werden können. Vor diesem Hintergrund haben sich viele Berufsbilder in den letzten Jahren sehr verändert und komplett neue sind hinzugekommen. In der Arbeitsforschung hat sich der neue Begriff des Information Workers bzw. Knowledge Workers herausgebildet. Für diese Infor mation Workers ist es wichtig mit thematischen Suchtechnologien, große Mengen von Dokumenten schnell zu finden und geschäftskritische Informationen aus ihnen zu extrahieren. Journalisten, Bibliothekare, Banker, Wirtschaftsprüfer, Ärzte, Wissenschaftler, Kundenbetreuer u.v.m. werden vermehrt auf Werkzeuge, die diese Technologien einsetzen, angewiesen sein. Mit dem Produkt Find-it der Canoo Engineering AG wird ein Anwendungsfall in einem Redaktionssystem gezeigt.

Überarbeiteter Beitrag basierend auf „Wie man mit der Wikipedia semantische Verfahren verbessern kann“. In: HMD – Praxis der Wirtschaftsinformatik, HMD-Heft Nr. 271, 48 (1): 70–80, 2010.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 64.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Hardcover Book
USD 84.99
Price excludes VAT (USA)
  • Durable hardcover edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Weitere Information zur Firmen- und Produktbeschreibung unter http://findit.canoo.com/

  2. 2.

    Die Munzinger-Archiv GmbH ist ein deutscher Verlag und Online-Informationsanbieter mit Sitz in Ravensburg http://www.munzinger.de/

  3. 3.

    http://de.wikipedia.org/wiki/Alexa_Internet

  4. 4.

    http://de.wikipedia.org/wiki/Wikipedia:Meilensteine

  5. 5.

    http://en.wikipedia.org/wiki/Main_Page

  6. 6.

    Ist eine Sammlung von Texten oder Äußerungen in einer Sprache.

  7. 7.

    http://wordnet.princeton.edu/

  8. 8.

    http://www.sfs.uni-tuebingen.de/lsd/

  9. 9.

    Das Projekt findet sich unter http://sourceforge.net/projects/wikipedia-miner/

  10. 10.

    Die Wikipedia ist in vielen Sprachen verfügbar (http://de.wikipedia.org/wiki/Wikipedia:Sprachen).

  11. 11.

    Weitere Infos zum Redaktionssystem http://www.red-web.com/

  12. 12.

    Damit ist es möglich Dokumente automatisch mit der entsprechenden Biographie aus dem Munzinger-Archiv zu verlinken https://www.munzinger.de/

  13. 13.

    Quelle Bilanz: http://www.bilanz.ch/bildergalerie/die-zehn-reichsten-der-reichsten

  14. 14.

    http://de.wikipedia.org/wiki/Wikipedia:Lizenzbestimmungen

  15. 15.

    http://download.wikimedia.org/

Literatur

  • Ankolekar, A., Krötzsch, M., Tran, T., Vrandecic, D.: The two cultures: mashing up Web 2.0 and the semantic web. In: 16th International World Wide Web Conference (WWW 2007). Banff, Alberta, (S. 825–834). Curran, Red Hook (2007)

    Google Scholar 

  • Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval. 2. Aufl. Addison-Wesley/ACM Press, New York (2011)

    Google Scholar 

  • Blumauer, A., Pellegrini, T. (Hrsg.): Social Semantic Web: Web 2.0 – Was nun? Springer, Berlin (2008)

    Google Scholar 

  • Bojars, U., Breslin, J.G., Finn, A., Decker, S.: Using the semantic web for linking and reusing data across Web 2.0 communities. J. Web Semant. 6(1), 21–28 (2008)

    Article  Google Scholar 

  • Buffa, M., Gandon, F.L., Sander, P., Faron, C., Ereto, G.: SweetWiki. J. Web Semant. 6(1), 84–97 (2008)

    Article  Google Scholar 

  • Bunescu, R., Pasca, M.: Using encyclopedic knowledge for named entity disambiguation. In: Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (EACL-06), Trento (2006)

    Google Scholar 

  • Cucerzan, S. Large-scale named entity disambiguation based on Wikipedia data. In: Proceedings of Empirical Methods in Natural Language Processing (EMNLP 2007), Prague (2007)

    Google Scholar 

  • Dengel, A.: Semantische Technologien: Grundlagen. Konzepte. Anwendungen. Spektrum Akademischer Verlag, Heidelberg (2012). ISBN 9783827426635

    Book  Google Scholar 

  • Finkelstein, L., Gabrilovich, Y.M., Rivlin, E., Solan, Z., Wolfman, G., Ruppin, E.: Placing search in context: the concept revisited. ACM Trans. Inf. Syst. 20(1), 406–414 (2002)

    Google Scholar 

  • Gabrilovich, E., Markovitch, S.: Overcoming the brittleness bottleneck using Wikipedia: Enhancing text categorization with encyclopedic knowledge. In: Proceedings of the Twenty-First National Conference on Artificial Intelligence, Boston (2006)

    Google Scholar 

  • Gabrilovich, E., Markovich, S.: Computing semantic relatedness using Wikipedia-based explicit semantic analysis. In: Proceedings of the 20th International Joint Conference on Artificial Intelligence (IJCAI’07), Hyderabad (2007)

    Google Scholar 

  • Hotho, A., Hoser, B. (Hrsg.): Bridging the Gap between Semantic Web and Web 2.0: Workshop located at the European Semantic Web Conference (ESWC 2007). Innsbruck, Austria. Retrieved 13 Nov 2008, from http://www.kde.cs.uni-kassel.de/ws/eswc2007/program.html (2007). Zgegriffen am 24.05.2016

  • Karttunen, I.: Constructing lexical transducers. In: The Proceedings of the 15th International Conference on Computational Linguistics. Coling 94, Bd. I, S. 406–411. Kyoto (1994)

    Google Scholar 

  • Koskenniemi, K.: Two-level morphology. A general computational model for word-form recognition and production. Department of General Linguistics, University of Helsinki (1983)

    Google Scholar 

  • Lange, C., Schaffert, S., Skal-Molli, H., Völkel, M. (Hrsg.): The Wiki Way of Semantics. In: Proceedings of the 3rd Semantic Wiki Workshop (SemWiki 2008) at the 5th European Semantic Web Conference (ESWC 2008), Tenerife. CEUR Workshop Proceedings, Bd. 360 (2008)

    Google Scholar 

  • Milne, D., Witten, I.H.: Learning to link with Wikipedia. In: Proceedings of the ACM Conference on Information and Knowledge Management (CIKM’2008), Napa Valley (2008)

    Google Scholar 

  • Milne, D., Witten, I.H.: An open-Source toolkit for mining Wikipedia. https://github.com/dnmilne/wikipediaminer (2009) . Zgegriffen am 24.05.2016

  • Pohl, A.: Improving the Wikipedia miner word sense disambiguation algorithm. In: Proceedings of Federated Conference on Computer Science and Information Systems 2012, S. 241–248, Wroclaw 9–12 Sept 2012, ISBN:978-83-60810-51-4

    Google Scholar 

  • Salton, G., McGill, M.J.: Introduction to Modern Information Retrieval. McGraw-Hill, New York (1983). ISBN 0070544840

    MATH  Google Scholar 

  • Zesch, T., Müller, C., Gurevych, I.: Extracting lexical semantic knowledge from Wikipedia and Wiktionary. In: Proceedings of the 6th International Conference on Language Resources and Evaluation (LREC 2008) S. 1646–1652, Paris (2008)

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Urs Hengartner .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2016 Springer Fachmedien Wiesbaden

About this chapter

Cite this chapter

Hengartner, U. (2016). Semantische Suchverfahren in der Welt von Big Data. In: Fasel, D., Meier, A. (eds) Big Data. Edition HMD. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-11589-0_13

Download citation

Publish with us

Policies and ethics