Please wait a minute...
Advanced Search
现代图书情报技术  2013, Vol. Issue (12): 27-33     https://doi.org/10.11925/infotech.1003-3513.2013.12.05
  专题 本期目录 | 过刊浏览 | 高级检索 |
利用领域本体优化文档检索的研究——基于KIM平台的设计与实现
金碧漪1, 郭金龙2, 许鑫1
1. 华东师范大学商学院信息学系 上海 200241;
2. 伊利诺伊大学香槟分校图书情报研究生院 香槟 61820
Research on Using Domain Ontology to Optimize the Document Retrieval——Design and Implementation on the KIM Platform
Jin Biyi1, Guo Jinlong2, Xu Xin1
1. Department of Information Science, Business School, East China Normal University, Shanghai 200241, China;
2. Graduate School of Library and Information Science, University of Illinois at Urbana-Champaign, Champaign, IL 61820, USA
全文: PDF (830 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 提出本体实体的语义标注策略。为验证此策略对于文档搜索结果的优化效果,借助于KIM平台,利用中华烹饪文化领域本体,首先将文档中实体与本体知识库中实例相互映射实现语义标注,接着通过索引用户查询条件与实例来实现语义查询,最后对结果进行测评,并融合关键词搜索结果对文档结果进行排序。研究表明基于本体的实体标注策略所达到的文档语义搜索能实现较良好的文档检索效果。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
金碧漪
郭金龙
许鑫
关键词 语义检索领域本体实体语义标注KIM    
Abstract:This paper proposes the strategy of entities label annotation based on Ontology. In order to verify the effectiveness of this strategy, by means of KIM platform, this paper uses Chinese cuisine culture domain Ontology as experimental data, mapping entities in document to the instances in Ontology knowledge base to achieve semantic annotation firstly, and then indexs the user query with instances to achieve the semantic retrieval. At last, the experimental results are evaluated. The study shows that the proposed strategy has a better performance on document retrieval.
Key wordsSemantic retrieval    Domain Ontology    Entity semantic annotation    KIM
收稿日期: 2013-08-16      出版日期: 2014-01-08
:  G250.7  
基金资助:本文系2011年度国家社会科学基金青年项目“联合虚拟参考咨询系统的知识库研究”(项目编号:11CTQ003)的研究成果之一。
通讯作者: 许鑫     E-mail: xxu@infor.ecnu.edu.cn
引用本文:   
金碧漪, 郭金龙, 许鑫. 利用领域本体优化文档检索的研究——基于KIM平台的设计与实现[J]. 现代图书情报技术, 2013, (12): 27-33.
Jin Biyi, Guo Jinlong, Xu Xin. Research on Using Domain Ontology to Optimize the Document Retrieval——Design and Implementation on the KIM Platform. New Technology of Library and Information Service, 2013, (12): 27-33.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2013.12.05      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2013/V/I12/27
[1] 朱庆生, 邹景华. 基于本体论的论文检索[J]. 计算机科学, 2005, 32(5):172-173, 176.(Zhu Qingsheng, Zou Jinghua. Paper Retrieve Based on Ontology[J].Computer Science, 2005, 32(5):172-173, 176.)
[2] 张赪军, 刘祥瑞, 李军, 等. 基于本体的语义检索技术研究[J]. 计算机工程与应用, 2010, 46(9S):373-376.(Zhang Chengjun, Liu Xiangrui, Li Jun, et al. Research of Semantic Retrieval Technology Based on Ontology[J]. Computer Engineering and Applications, 2010, 46(9S):373-376.)
[3] Kara S, Alan Ö, Sabuncu O, et al. An Ontology-based Retrieval System Using Semantic Indexing[J]. Information Systems, 2012, 37(4): 294-305.
[4] Kawtrakul A. Ontology Engineering and Knowledge Services for Agriculture Domain[J]. Journal of Integrative Agriculture, 2012, 11(5): 741-751.
[5] 杜建, 张士靖. 基于领域本体的生物医学语义检索机制研究——以GoPubMed和SEGoPubMed为例[J]. 数字图书馆论坛, 2010(7):56-61.(Du Jian, Zhang Shijing. Research of Biomedical Semantic Retrieval Based on Domain Ontology——A Case Study of GoPubMed and SEGoPubMed[J].Digital Library Forum, 2010(7):56-61.)
[6] 孙成国. 基于大学领域本体的语义检索技术研究[D]. 太原:中北大学, 2012.(Sun Chengguo. Research of Semantic Retrieval Technology Based on the University Domain Ontology[D].Taiyuan: North University of China, 2012.)
[7] 牛强, 邱波, 夏士雄, 等. 基于领域本体的学习资源语义检索模型[J]. 计算机应用研究, 2008, 25(7):1977-1982.(Niu Qiang, Qiu Bo, Xia Shixiong, et al. Research on Domain Ontology-based Semantic Retrieval Model of Leaning Resources[J]. Application Research of Computers, 2008, 25(7):1977-1982.)
[8] 于静, 吴国全, 卢燚. 基于领域本体的政务信息检索系统[J]. 计算机应用, 2010, 30(6):1664-1667.(Yu Jing, Wu Guoquan, Lu Yi. Government Information Retrieval Based on Domain Ontology[J].Journal of Computer Applications, 2010, 30(6):1664-1667.)
[9] 李兆龙. 基于领域本体的旅游信息检索系统研究与实现[D].北京:北京邮电大学, 2012.(Li Zhaolong. Study and Implementation of Tourism Information Retrieval System Based on Domain Ontology[D].Beijing: Beijing University of Posts and Telecommunications, 2012.)
[10] 时念云, 杨晨.基于领域本体的语义标注方法研究[J]. 计算机工程与设计, 2007, 28(24):5985-5987.(Shi Nianyun, Yang Chen. Towards Domain Ontology-based Semantic Annotation Research[J]. Computer Engineering and Design, 2007, 28(24):5985-5987.)
[11] 秦春秀, 赵捧未, 窦永香.一种基于本体的语义标引方法[J]. 情报理论与实践, 2005, 28(3):244-246.(Qin Chunxiu, Zhao Pengwei, Dou Yongxiang. A Way of Ontology-based Semantic Indexing[J].Information Studies: Theory & Application, 2005, 28(3):244-246.)
[12] 张辉, 王英林. 基于本体的面向概念信息检索模型研究[J]. 微计算机信息, 2009, 25(2-3):185-187.(Zhang Hui, Wang Yinglin. Research of an Ontology-based and Concept-oriented Information Retrieval Model[J]. Microcomputer Information, 2009, 25(2-3): 185-187.)
[13] 荆涛, 左万利, 孙吉贵, 等.中文网页语义标注: 由句子到RDF 表示[J]. 计算机研究与发展, 2008, 45(7): 1221-1231.(Jing Tao, Zuo Wanli, Sun Jigui, et al. Semantic Annotation of Chinese Web Pages:From Sentences to RDF Representations[J]. Journal of Computer Research and Development, 2008, 45(7): 1221-1231.)
[14] Vallet D, Fernández M, Castells P. An Ontology-based Information Retrieval Model[C].In: Proceedings of the 2nd European Semantic Web Conference on Semantic Web: Research and Applications(ESWC 2005), Heraklion, Crete, Greece.Springer, 2005: 455-470.
[15] 侯玉芳, 耿骞. KIM——一个基于本体的信息检索平台[J]. 现代图书情报技术, 2005 (8):27-31.(Hou Yufang, Geng Qian. KIM——An Information Retrieval System Based on Ontology[J]. New Technology of Library and Information Service, 2005(8):27-31.)
[16] Kiryakov A, Popov B, Terziev I, et al. Semantic Annotation, Indexing, and Retrieval[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2004, 2(1): 49-79.
[17] 白如江, 王效岳.基于KIM的语义检索系统研究[J]. 图书馆理论与实践, 2010(10):56-58.(Bai Rujiang, Wang Xiaoyue. Research Based on KIM Semantic Retrieval System[J].Library Theory and Practice, 2010(10):56-58.)
[18] OntoText.Customizing KIM[EB/OL].[2013-01-23]. http://www.ontotext.com/sites/default/files/Customizing%20KIM3.pdf.
[19] GATE. Ontologies and Semantic Annotation[EB/OL].[2013-02-21].http://gate.ac.uk/sale/talks/gate-course-may10/track-3/module-10-ontologies/ontologies.pdf.
[20] 中文分词器ICTCLAS使用方法(Java)[EB/OL].[2013-04-22]. http://www.cnblogs.com/CheeseZH/archive/2012/11/27/2791037.html.(The Usage of Chinese Segmentation ICTCLAS(Java)[EB/OL].[2013-04-22]. http://www.cnblogs.com/CheeseZH/archive/2012/11/27/2791037.html.)
[21] 使用Lucene3.6创建索引和实现简单搜索[EB/OL].[2013-04-24]. http://blog.csdn.net/youyajie/article/details/7487498. (Use Lucene3.6 to Create Simple Indexing and Search[EB/OL].[2013-04-24]. http://blog.csdn.net/youyajie/article/details/7487498.)
[1] 何有世, 何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[2] 陆佳莹,袁勤俭,黄奇,钱韵洁. 基于概念格理论的产品领域本体构建研究*[J]. 现代图书情报技术, 2016, 32(5): 38-46.
[3] 鲍玉来,毕强. 蒙古文音乐领域的语义检索初探*[J]. 现代图书情报技术, 2016, 32(11): 94-100.
[4] 王颖, 吴振新, 谢靖. 面向科技文献的语义检索系统研究综述[J]. 现代图书情报技术, 2015, 31(5): 1-7.
[5] 张帆, 乐小虬. 领域科技文献创新点句中主题属性实例识别方法研究[J]. 现代图书情报技术, 2015, 31(5): 15-23.
[6] 段宇锋, 朱雯晶, 陈巧, 刘伟, 刘凤红. 条件随机场与领域本体元素集相结合的未登录词识别研究[J]. 现代图书情报技术, 2015, 31(4): 41-49.
[7] 段宇锋, 黄思思. 基于BFO构建中文植物物种多样性领域本体的研究[J]. 现代图书情报技术, 2015, 31(12): 72-79.
[8] 颜时彦, 王胜清, 罗云川, 黄浩军. 云环境下基于FCA的领域本体协作构建模式初探[J]. 现代图书情报技术, 2014, 30(3): 49-56.
[9] 唐守利, 徐宝祥. 基于本体的云服务语义检索系统研究[J]. 现代图书情报技术, 2014, 30(12): 27-35.
[10] 毕强, 王雨. 国外Folksonomy应用研究的前沿进展及热点分析[J]. 现代图书情报技术, 2013, 29(7/8): 36-42.
[11] 姚晓娜, 祝忠明, 王思丽. 面向地学领域的自动语义标注研究[J]. 现代图书情报技术, 2013, (4): 48-53.
[12] 许鑫, 郭金龙. 基于领域本体的专题库构建——以中华烹饪文化知识库为例[J]. 现代图书情报技术, 2013, (12): 2-9.
[13] 郭金龙, 洪韵佳, 许鑫. 中华烹饪文化领域本体构建及其应用[J]. 现代图书情报技术, 2013, (12): 10-18.
[14] 洪韵佳, 许鑫. 基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例[J]. 现代图书情报技术, 2013, (12): 19-26.
[15] 唐晓波, 肖璐. 融合关键词增补与领域本体的共词分析方法研究[J]. 现代图书情报技术, 2013, 29(11): 60-67.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn