“大数据”及BOB半岛体育其特征
BOB半岛体育大数据是指那些大小超出了传统意义的尺度,一般软件工具难以捕捉、存储、管理和分析的数据。对大数据的定义:大数据指的是所涉及的资料量规模巨大到无法通过目前主流软件工具BOB半岛体育,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。换而言之,大数据的数据资料体量巨大、数据结构复杂,一些常用的软件工具无法在合理的时间内对这些数据进行有效的管理、搜集、处理、分析。
国家统计局原副局长郑京平等曾撰文将“BigData”翻译成海量电子化数据BOB半岛体育,并解释“BigData”是指在行政管理、生产经营、商务活动等众多领域以电子化数据的形式产生、积累和存储的行政记录和商业记录BOB半岛体育。《大数据在政府统计中的探索与应用》(2013)一书中指出,对政府统计工作而言,大数据是采用多种数据收集方式、整合多种数据来源的数据,是采用现代信息技术和架构高速处理和挖掘,具有高度应用价值和决策支持功能的数据、方法及其技术集成。
实际上BOB半岛体育,被广泛接受的一般意义的大数据(BigData)是指一切数据的集合,既包括传统的结构化数据,也包括非结构化数据、半结构化数据BOB半岛体育。结构化数据具有统一的结构并可以用数字进行表示;非结构化数据则无法用统一的结构和数字来表示,包括所有格式的文档文本、网页图片和视频音频等;半结构化数据既有数字数据信息,又有图片、音频等非结构化数据信息。