笑话大全网 - 笑话小品 - 对大数据时代的思考

对大数据时代的思考

《大数据时代》是国外大数据系统研究的第一部著作,该书作者是维克多?迈耶?勋伯格被称为?大数据商业应用第一人?先后在哈佛大学、牛津大学、耶鲁大学、新加坡国立大学任教,早在2065,438+00年就在《经济学人》发表了65,438+04页的大数据应用前瞻研究。以下是阅读这本书的范文。欢迎阅读!

对大数据时代的思考(1)

我们不再热衷于寻找因果关系,而应该寻找事物之间的关联。这个命题是我看这本书最大的感触。个人认为也是这本书的核心思想。让我们从头开始。首先,书中提出了一个颠覆我之前认知的命题——?不是原子而是信息是万物的起源?将世界视为信息和可理解数据的海洋为我们提供了前所未有的视角。这是一种可以渗透到生活各个领域的世界观。这一主张在本书最后一部分的一个段落中有所描述。我之所以把它放在最前面,是因为我认为这是谈论数字世界的前提,自然也是谈论大数据的前提。书中间有一节讲的是数字化和数字化的区别。整理完自己的大脑,数字世界的命题被列为大数据思维的第二步。写到这里,我不禁反思自己是否领悟到了书中的精髓(我认为的精髓),这是第一句话。因为回过头来看我的整个思维,还是按照旧的因果思维模式来思考。这本书的另一个吸引人的地方是观点很多,会从哲学的角度来讨论。虽然我肚子里的墨水不多,但是当我读到这些描述的时候,我会发现我会更好的理解作者提出的命题。例如,书中有一段话

我们说人类通过因果关系认识世界,是指我们用来认识和解释世界上各种现象的两种基本方法:一种是通过快速虚幻的因果关系,另一种是通过缓慢有序的因果关系。大数据将改变这两种基本方法在我们理解世界中的作用。

在附上一些例子的时候,用作者提供的?精华?你一看,就很容易明白,确实是这样。好吧,那么大数据改变了我们什么?作者给出三点。

大数据的本质在于我们分析信息时的三个变化。这些变化谈论的是改变我们理解和形成社会的方式。

第一个变化是,在大数据时代,我们可以分析更多的数据,有时甚至可以处理与某一特定现象相关的所有数据,而不是依靠随机抽样(样本=总体)。

第二个变化是研究数据太多,我们不再热衷于追求准确性。

第三个变化是由前两个变化引起的,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关性。大数据告诉我们?这是什么?而不是。为什么?。大数据时代,我们不需要知道现象背后的原因,我们只需要让数据自己说话。

众所周知,人脑有这样一个功能,它会将新的输入刺激或信息与?过去的经验还是积累的知识?对比,然后调整,接受。如果眼前的新现实不能与你大脑中储存的固有信息相协调,你就会不自觉地拒绝接受新现实(就像没看见一样);或者通过自己的一知半解任意猜测,使自己意识到的情况偏离现实(产生错觉)。这是人类的一种本能,旨在让自己保持冷静。

所以作者称之为革命。

说了这么多,大数据给我们带来了什么?在这里我只想说一下我感受最深的,其他感兴趣的可以自己了解。当然,书中有很多,最多的就是XXX公司或个人利用大数据创造了多少财富。抛开这些表面的东西,最让我动心或者害怕的是预测。这是大数据带来的最核心的东西。不需要重复动心的理由。电脑会告诉你什么时候买双色球中头奖。想想你是不是有点激动。当然,这只是我打了一个夸张的比喻。关于恐惧,书里有一段话我很喜欢。

公平正义的基础是,人们只有在做了某件事之后才需要对这件事负责。毕竟,想做而不做并不是犯罪。社会与个人责任相关的基本信念是,人们应该为自己选择的行为负责。如果大数据分析完全准确,那么我们的未来就会被准确预测,那么在未来,我们不仅会失去选择的权利,还会根据预测行动。如果准确预测成为现实,我们将失去自由意志和自由选择的权利。既然我们别无选择,就不需要承担责任。这不是很讽刺吗?

拉到这里,顺便说一下,书中对自由意志的另一种描述。

在哲学领域,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果一切都有因果,那么我们就没有决定任何事情的自由。如果我们做的每一个决定或想法都是其他事情的结果。而这个结果是其他原因造成的。在这个循环中,就不存在人类的自由意志了。所有的人生轨迹都只受因果关系控制。因此,哲学家们对因果关系在世界中的作用争论不休,有时他们认为这是自由意志的对立面。

书中举了一个例子,举了一部电影《少数派报告》。看到这里的时候,哦,其实我看过这部电影。想想还是有点激动。有兴趣的可以看看。大概是警察通过预测提前抓捕犯人,但不是通过大数据,而是通过一种超人的方式。当你做的每一件事都可以预测的时候,就相当于你完全暴露在阳光下。如果是你,你会害怕吗?

最后附上两个后记,一个是书中的一段话,一个是自己编的。

大数据并不是一个充满算法和机器的冰冷世界,人类的作用仍然无法被完全取代。大数据给我们提供的不是最终答案,而是参考答案。帮助是暂时的,更好的方法和答案还在不久的将来。

大数据最终会影响到我们,它会像其他技术一样是一把双刃剑。用得好,动心,虐,怕。就像核技术,用了就造福地球,滥用了,给你一个钻石地球,还是会爆炸。我相信,大数据未来的发展,会像作者说的那样,是一场生活、工作、思维的革命。

大数据时代的思考(2)

去年?云计算?今年是油炸的吗?大数据?又一次突然袭击。好像一夜之间,所有厂商都改旗易帜推高了?大数据?它来了。于是,各个企业的CIO也把目光投向了热火?大数据?它来了。有一幅来自《程序员》微博的漫画很生动。我觉得这张图确实反映了中小企业云计算和大数据的现状。

不过话说回来,《大数据时代》是本好书。

当然,很多IT名人也极力推荐,并写了很多评论来表达对这本书的喜爱。在看这本书之前,我基本上对所谓大数据的概念很迷茫。虽然我关注过现在也很火的BI,但是感觉差不多。可能是更多的数据,更细致的数据分析和数据挖掘。看完这本书,感觉之前的想法只能算小半——海量数据,而另一个:关注数据相关性,而不是数据准确性,可能是大数据和现在BI最大的区别,不仅仅是方法,更多的是思维方式。但坦白说,数据的相关性更好还是数据的准确性更好,真的需要时间来检验。至少从目前的数据分析方法来看,更倾向于数据的准确性。看完这本书,我心中有些疑问:

1.什么是大数据?

查了一下百度百科,是这样定义的:bigdata,或称巨量数据,是指涉及的数据量大到无法通过目前主流的软件工具捕捉、管理、处理、整理成更有积极意义的目的来帮助企业在合理的时间内进行商业决策的信息。大数据的4V特征:量、速度、多样性、保真度——这似乎是IBM的定义。

个人观点:海量数据和海量存储是大数据的基本原型。

2.大数据适合什么样的企业?

诚然,大数据的前提是海量的数据。有了海量的数据资源,才能找出数据的关联性,让它过去。

专业的待遇,让它为企业产生价值。对于电信运营来说,在互联网上使用如此海量用户数据的大型企业,在应用大数据的道路上也有得天独厚的条件,但是中小企业呢?销售订单数据?如果不是百年老店,估计数据少得可怜。5.只能使用消费者数据。好像大部分厂商,比如对消费者的购买行为分析的最多。同样,在公共部门,大数据的作用也可能起到很好的作用。相反,我感觉大部分中小企业应用大数据似乎有点大问题。书上说:大数据是企业的竞争力。诚然,数据是企业最核心的无形资源(如果用得好的话),但是否所有的数据,或者换句话说:所有的企业都有大数据的竞争力,真的合适吗?会不会显得中小企业小题大做?

3.大数据的影响

当一波又一波的IT技术热潮来到我们的铺面时,你甚至还没有做好准备,就要开始迎接它给你带来的冲击。借助物联网和云计算,大数据开始出现。但是它给我们带来了什么?

1)预测未来从Google成功预测未来可能发生的流感的案例开始,说明大数据的应用可以作为我们生活的指南。本质很简单,技术改变世界。

2)转化商业大数据带来的商业机会,也将催生一系列与大数据相关的商业机会和商业模式,数据的潜在价值将继续发挥作用。很容易想象,未来会产生一个数据产业链,有专门的数据采集、数据分析、数据生成。当然,IT公司的影响最大。

3)《易思维之书》说:因为有海量的数据作为基础,未来我们可能会更注重数据的相关性而不是精细度。我对这篇文章还是有保留的。

大数据时代的思考(三)

如今,提到新媒体和互联网,就不得不提大数据。好像不说这个就出局了。更何况还有很多人云亦云,很多空谈家连舍恩·白鸽的经典著作《大数据时代》都没读过。维克多?迈尔·勋伯格是谁?现任牛津大学网络学院互联网研究所治理与监管教授,曾任哈佛大学肯尼迪学院信息监管研究项目负责人。他的咨询客户包括微软、惠普和IBM,他是欧盟官方互联网政策背后的真正制定者和参与者。他还担任过许多国家高级政府的智囊团。这被誉为:大数据时代的先知?牛津教授牛逼!所以,大师说的是金科玉律?不一定,读大师们的作品一定要做一些功课。如果你能做足功课,有相应的理论基础,可以和他们进行思想上的对话。

勋伯格分三个部分论述大数据,即思维变革、业务变革和管理变革。在第一部分?大数据时代的思维变革?在这篇论文中,勋伯格明确表明了他的三个观点:一、多:不是随机样本,而是所有数据;二、更杂:不是准确,而是杂糅;第三,更好:不是因果关系,而是相关性。我不同意第一点。一方面,从技术和设备上来说,处理所有的数据是非常困难的。另一方面,是不是每个人都有必要?判断简单事实的数据分析有必要收集所有数据吗?我和香港城市大学的祝建华教授讨论过这个问题。朱教授是传播学研究方法和数据分析的专家。他认为可以找一种数理统计的方法进行分析,不一定需要所有的数据。联系到勋伯格第二个观点中提到的相关性,我理解他说的总数据不是指数量而是指范围,即大数据的随机样本不仅限于目标数据,还包括目标之外的所有数据。我认为大数据分析不能排除随机抽样,但抽样的方法和范围要扩大。

我同意勋伯格的第二个观点。我觉得是对他第一个观点很好的补充,也是对精准传播和精准营销的反思。?大数据的简单算法比小数据的复杂算法更有效。?更多宏观视野和东方哲学思维。我不能完全同意勋伯格的第三点。?不是因果关系,而是相关性。?不需要知道?为什么?只是需要知道?这是什么?。沟通是数据,数据是关系。在小数据时代,人们只关心因果关系,却对相关性了解不够。大数据时代,相关性的作用举足轻重,怎么强调都不为过,但也不应该完全排除。大数据从何而来?它是用来做什么的?如果完全忽略因果关系,不知道大数据的前因后果,也会消解大数据的人文价值。现在很多学者为了阐述和传播自己的观点,往往语出惊人,全盘否定旧观念。

世界上任何事物的复杂性和多样性都不是简单的非此即彼。勋伯格也是这种二元对立的幼稚思维吗?其实,读者在阅读时一定要看清自己是在什么语境下说的,不要因为阅读的浅薄而陷入断章取义的误区。例如,勋伯格提出?不是因果关系,而是相关性。?他在作出这一论断时,还在书中说:?大多数情况下,一旦我们完成了大数据的关联分析,就不再满足于仅仅知道?这是什么?届时,我们将继续深入研究其中的因果关系,找出背后的原因。为什么?。?[i]可见,他所说的所有数据和相关关系都是在特定的语境下,是数据挖掘中的选项。

大数据研究的驱动力之一是商业化。在第二部分,勋伯格讨论了大数据时代的商业变革。勋伯格认为数字化意味着一切皆有可能?量化?大数据的量化分析是有力的回答?这是什么?这个问题,却还是无法完全回答?为什么?。所以我觉得不能排除定性分析和定性研究。毫无疑问,数据创新可以创造价值。在讨论大数据的角色定位时,勋伯格仍然把它放在数据应用的商业体系中,而没有放在整个社会体系中,但他在《大数据时代的管理变革》第二部分讨论了这个问题。在风险社会,信息安全问题日益突出,数据独裁和隐私保护成为一对矛盾。如何摆脱大数据的困境?勋伯格在最后一节?控制?我试着回答了一下,基本都是老生常谈。我想,也许凯文?凯利的失控可以帮我们回答这个问题?至少可以提供更多的思考维度。正如勋伯格在结论中所说:?大数据并不是一个充满算法和机器的冰冷世界,人类的作用仍然无法被完全取代。大数据给我们提供的不是最终答案,而是参考答案。帮助是暂时的,更好的方法和答案还在不久的将来。?谢谢勋伯格。让大数据讨论从自然科学回归到人文社会科学。可以推断,“大数据时代”不是最终答案,也不是标准答案,而是参考答案。

另外,在看这本书之前,你必须要有一些数据科学的基础知识和概念,比如什么是数据?什么是大数据?数据分析和数据挖掘有什么区别,数字化和数据化有什么区别?读书前做点功课,读起来会轻松一些。