基于元数据的语义识别搜索方法的研究与实现Research and implementation of semantic recognition search engine based on the metadata
王星星,毕建涛,池天河
摘要(Abstract):
搜索技术是当前网络领域中最为热门的研究领域,搜索引擎的好坏在很大程度上决定了用户使用网络资源的效率高低。搜索引擎的效率主要是取决于系统对用户输入检索词的解析与识别。因此一个好的搜索引擎需要能够对用户输入的信息进行语义解析,准确有效地对用户意图进行识别、解析与理解,并为用户返回最为合适的搜索结果。本文设计开发了一种基于元数据的网络搜索语义识别算法,并成功应用于中国可持续发展信息共享系统中,建立基于可持续发展元数据的搜索引擎,对用户的不同需求提供不同的元数据搜索方式,最终根据可持续发展共享数据与元数据的映射关系,实现由基于数据分类存储模式的数据共享服务转变为以元数据搜索为驱动的数据共享服务模式,为用户提供了高效的可持续发展元数据搜索引擎,极大提高了中国可持续发展信息共享系统的数据共享服务能力。
关键词(KeyWords): 语义;元数据;搜索引擎;模式识别;XML
基金项目(Foundation): 国家“十五”科技攻关计划“中国可持续发展信息共享系统的研究开发”(2004-BA608B);; 国家基础性条件平台“中国可持续发展信息共享平台建设”(2003DEA2C011)
作者(Author): 王星星,毕建涛,池天河
参考文献(References):
- [1]Stefan Decker,Prasenjit Mitra,Sergoy Melnik.Framework for thesemantic Web:An RDF tirtorial[J].IEEE Internet Computing,2000,4(2):16-37.
- [2]何建邦,蒋景陵.我国地理信息标准化工作的回顾与思考[J].测绘科学,2006,31(3).
- [3]ISO/TC21119115 N1142.Geographics Information/Geomatics[S].Norwegian Technology Center.
- [4]毕建涛,何建邦,池天河,曹彦荣.模型与方法元数据及地理信息服务研究[J].地理学报,2002,57.
- [5]Erik Hatcher and Otis Gospodneti-,Lucene in action[EB/OL].http://www.manning.com,2006-08-15
- [6]Nutch Open Source Material[Z].http://lucene.apache.org/nutch/tutorial8.html.
- [7]Jeen Broekstra.Storage,quering and inferencing for semantic Weblanguages[J].The Dutch Graduate School,2005,9(7):474-489.
- [8]刘若梅,蒋景瞳,贾云鹏.中国地理信息元数据标准研究[M].北京:科学出版社,1999:36-46.
- [9]储荷婷,等.Internet网络信息检索——原理、工具、技巧[M].北京:清华大学出版社,1999.