世界的本质是数据——大数据研究专家维克托-舍恩伯格

谢邀。

世界的本质是数据

——大数据研究专家维克托·迈尔-舍恩伯格博士

在维克托·迈尔-舍恩伯格博士看来:

认识大数据之前,世界原本就是一个数据时代;

认识大数据之后,世界却不可避免地分为大数据时代、小数据时代。

《大数据时代》作者之一 维克托•迈尔-舍恩伯格博士

谈论核心价值之前,我们先来看看什么是大数据:

很多人这样理解大数据“大数据就是大规模的数据”,这个说法真的准确吗?

其实“大规模”只是指数据的量而言,数据量大,但并不代表着数据一定有可以被深度学习算法利用的价值。例如:地球绕太阳运转的过程中,每一秒钟记录一次地球相对太阳的运动速度、位置,可以得到大量数据。可如果只有这样的数据,其实并没有太多可以挖掘的价值!

关于大数据这里我们参阅马丁·希尔伯特的总结,今天我们常说的大数据其实是在2000年后,因为信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据:

信息交换:

据估算,从1986年到2007年这20年间,地球上每天可以通过既有信息通道交换的信息数量增长了约217倍,这些信息的数字化程度,则从1986年的约20%增长到2007年的约99.9%。在数字化信息爆炸式增长的过程里,每个参与信息交换的节点都可以在短时间内接收并存储大量数据。

图片[1]-世界的本质是数据——大数据研究专家维克托-舍恩伯格-老王博客

信息存储:

全球信息存储能力大约每3年翻一番。从1986年到2007年这20年间,全球信息存储能力增加了约120倍,所存储信息的数字化程度也从1986年的约1%增长到2007年的约94%。1986年时,即便用上我们所有的信息载体、存储手段,我们也不过能存储全世界所交换信息的大约1%,而2007年这个数字已经增长到大约16%。信息存储能力的增加为我们利用大数据提供了近乎无限的想象空间。

信息处理:

有了海量的信息获取能力和信息存储能力,我们也必须有对这些信息进行整理、加工和分析的能力。谷歌、Facebook等公司在数据量逐渐增大的同时,也相应建立了灵活、强大的分布式数据处理集群。

信息交换 信息存储 信息处理

大数据具有数据规模大、数据类别复杂、数据处理速度快、数据真实性高、数据蕴藏价值的特点,对于大数据的处理和挖掘很大程度上需要依赖于云计算平台的分布式处理、分布式数据库、云存储和虚拟化技术。

关于大数据的应用和价值:

我们先来看一则新闻聊天机器人竟自创语言“对话” 脸书将其紧急关停,大数据被认为是人工智能的一部分,大数据也被称之为“人工智能的基石”。目前的深度学习主要是建立在大数据的基础上,即对大数据进行训练,并从中归纳出可以被计算机运用在类似数据上的知识或规律。

美国《大西洋月刊》公布的一段A.I.聊天记录截图

实际上无论是人工智能还是云计算的蓬勃发展,离不开海量数据的支撑,云计算、大数据、人工智能也被称之为“铁三角”的关系。

图片[2]-世界的本质是数据——大数据研究专家维克托-舍恩伯格-老王博客

实际上无论是人工智能还是云计算的蓬勃发展,离不开海量数据的支撑,云计算、大数据、人工智能也被称之为“铁三角”的关系。

其实,大数据已经无所不在!

当你热议互联网杀熟的时候,背后可能是大数据要背锅;

当你在某个平台上提交你的信息,也许紧接着你还会收到保险公司、借贷机构等热情轰炸;

当你在淘宝、京东、头条、携程等逛逛看看的时候,你会发现这些app越来越懂你,因为他们会越来越精准的推送给你喜欢的产品、感兴趣新闻话题;

基于大数据,电商会在大促之前做好需求预测,提前布局仓库存储;

基于大数据,谷歌、高德、百度等地图工具服务商能够提供越来越精准的数据拟合;

基于大数据,航空公司通过分析温度、响声、振幅、飞行时间等研究来进行设备故障的预防。

大数据往往可以取代传统意义上的抽样调查,大数据混合了来自多个数据源的多维度信息。

大数据的价值在于数据分析以及分析基础上的数据挖掘和智能决策,通过对数据的分析,发现数据的变化以及各数据间的相关性、挖掘以往被忽视的规律、获得具有洞察力和新价值的东西,实现对人类行为的预测,从而可以有针对性地做出商业决策。

大数据可能告诉我们,未来会发生什么,但也许并不能解释背后的原因;

大数据帮助产品更好的了解用户、服务用户,但其实背后的大数据本身已经成为一款产品;

大数据在大数据时代正在迅速膨胀,有有利一面,但同时背后可能隐藏着“蝴蝶效应”的隐患!

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论