大数据视角下的多源组织机构代码信息融合方法Information fusion method of multi-source organization codes through Big Data perspective
薛纯,张福浩,赵阳阳,张湉湉
摘要(Abstract):
大数据的产生为电子政务带来了新的机遇与挑战,也为作为电子政务信息资源之一的组织机构代码提供了全新的认知理解角度。目前政府决策时使用的数据信息资源仍未完全统一,存在数据结构和类型差异明显、数据资源不统一等问题。为了使这些孤立的数据能够更好地实现资源共享,把位于不同信息源上的数据融合起来,本文在分析讨论组织机构代码和大数据共同特点的基础上,提出一种基于多源组织机构代码信息的数据融合方法。该方法基于组织机构代码、法人信息、组织机构名称3个方面信息,实现不同来源的信息融合。实验表明,该方法的融合率达到97%,准确率为87.4%。
关键词(KeyWords): 组织机构代码;多源;数据融合;大数据
基金项目(Foundation): 国家高技术研究发展计划(G1213);; 国家科技支撑计划(2012BAH24B02,2012BAK15B04)
作者(Author): 薛纯,张福浩,赵阳阳,张湉湉
DOI: 10.16251/j.cnki.1009-2307.2014.05.037
参考文献(References):
- [1]“组织机构代码在国家信息化和电子政务建设中的基础性作用研究”课题组.组织机构代码在电子政务和信息化建设中的基本作用[J].电子政务E-GOVERNMENT,2011(2):34.
- [2]“组织机构代码在国家信息化和电子政务建设中的基础性作用研究”课题组.组织机构代码与我国的法人及法人制度[J].电子政务E-GOVERNMENT,2011(2):4.
- [3]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012(6):648.
- [4]Grobelnik M.Big-data computing:Creating revolutionary breakthroughs in commerce,science,and society[R/OL].[2012-10-02].http://videolectures.net/eswc2012_grobelnik_big_data/.
- [5]全国组织机构代码管理中心.组织机构代码系统工程[M].北京:中国计量出版社,2003.
- [6]顾迎建.组织机构代码系统工程[M].北京:中国计量出版社,2004.
- [7]徐炎.组织机构代码数据质量现状及对策分析[J].学术,2010(1):33.
- [8]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):148.