Map/Reduce框架下的粗糙集空间数据挖掘改进算法Improvement of spatial data mining algorithm of rough set under framework of Map/Reduce
刘琼,赵荣,孙立坚
摘要(Abstract):
大数据时代,传统的空间数据挖掘算法在挖掘海量空间数据信息时存在计算能力和存储能力不足的瓶颈。为解决此问题,本文在研究粗糙集基本理论和Map/Reduce框架的基础上,对传统的粗糙集空间数据挖掘算法进行基于Map/Reduce的高效、廉价的并行化改进。实验表明,在处理大数据时,改进后的模糊集并行空间数据算法能有效提高算法的效率,满足人们处理海量空间数据的需求。
关键词(KeyWords): 大数据;空间数据挖掘;模糊集;Map/Reduce;并行化
基金项目(Foundation): 国家高新技术研究发展计划(863计划)(2012AA12A309);; 国家科技支撑计划(2012BAH24B02)
作者(Author): 刘琼,赵荣,孙立坚
DOI: 10.16251/j.cnki.1009-2307.2014.05.008
参考文献(References):
- [1]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013,25(8):142-146.
- [2]Z Pawlak.Rough Sets:theoretical aspects of reasoning about data[M].Netherlands:Kluwer Academic Publishers,1991.
- [3]Dean J,Ghemawat S.MapReduce:simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
- [4]SHEKAR S,XIONG H(Eds.).Encyclopedia of GIS[M].New York:Springer,2007.
- [5]RAJARAMAN A,ULLMAN J D.Mining of Massive Datasets[M].Cambridge:Cambridge University Press,2011.
- [6]MILLER H J,HAN J.Geographic Data Mining and Knowledge Discovery[M].2nd edition.London:Taylor and Francis,2009.
- [7]李智玲,胡彧.改进的属性约简算法在数据挖掘中的应用研究[J].计算机技术与发展,2012,22(10):47-50.
- [8]Jeffrey Dean,Sanjay Ghemawat.MapReduce:Simplified Data Processing on Large Clusters[M].2004.
- [9]刘义,景宁,陈荦,熊伟.MapReduce框架下基于R-树的k-近邻连接算法[J].软件学报,2013,24(8):1836-1851.
- [10]http://www.datatang.com/data/44060.