翻开《大数据时代》,震惊之下的反思充盈我的脑海。虽然开篇序言声明“大数据”不仅是“数据大”,但首先进入我脑海的依然是超大容量的数据计量单位。目前我所知道并且已经涉及到的是KB、MB、GB,知道但尚未涉及的是TB,而这本书告诉我人类已经创造并使用了更大的计量单位,有PB、EB、ZB,每一个计量单位之间的差距都是2 10倍。这让我震惊,无法想象相当于我的电脑240倍容量的数据是个多么广阔的数据海洋!震惊之下,我不禁深深思索,要如何在这数据的海洋里找寻所需的数据,要运用怎样的技术和方法去处理这海量的数据,要如何去分析、运用甚至掌握数据的处理结果……,而这不正是统计的整个流程!在大数据和云计算技术革命的大前提下,与大数据紧密相关的统计必将面临巨大的变革。如何应对这个新的挑战,经过反复思索,我认为统计必须要实现以下三个重大转变。
首先,分析与事物相关的所有数据,而不是依靠分析少量的样本数据。对于统计人员来说,准确分析大量数据是一种挑战,因为记录、存储和分析数据的工具不够好,在面对数量庞大的统计对象时,出于对统计成本和统计时效的综合考虑,通常是采取随机抽样的方法,通过对少量样本的分析来获取最多的信息,即在尽可能短的时间,花尽可能少的经费,用尽可能小的数据,来证实可能重大的发现、假设等。中国每十年开展一次人口普查,每五年开展一次经济普查,最近的一次人口普查是20xx年,而我们正式获取和使用则到了20xx年;最近的一次经济普查是20xx年,但我们目前尚未获得迫切需要的平均工资数据。这就是当前统计面临的难题,即使花费大量经费,动员大量调查人员,但难以快速地处理数据。大数据时代来了,计算和制表不再像过去那样困难,感应器、手机导航、网站点击和微博微信等能够收集大量数据,同时计算机也能够轻易处理。因此,在处理大数据时,不再用随机抽样的方法,而利用所有数据进行分析。分析……
预览阅读已结束,若您需要全文或代笔。
请点击👉 mooonya 👈联系老师
- 下一篇:县扶贫办扶贫脱贫政策授课讲稿