互联网改变了什么？机器如何更好地索引世界-老王博客

文/于凯

随着互联网时代的到来，人类科技的发展必然会带来一定的便利，但一旦机器变得比人类更聪明，除了人类灵性的大幅提升，还能有什么解决方案呢？我在互联网上工作了这么久，让我们看看互联网发生了哪些变化？

互联网发生了哪些变化？

互联网的本质就像微信打开时的画面，蕴含着深刻的哲学思想：纷繁复杂的世界，我们与世界的关系是什么？为了解决这个问题，孔子提出了“仁”，宗教提出了“世界的另一边”，互联网提出了“人与世界的连接”。连接人和世界时，包括连接人和信息（如百度）、连接人和商品（如亚马逊、淘宝）、连接人和连接人（如微信）、连接人和服务（如滴滴、优步），从而孕育了大的产业机会，发生了很多大事，产生了巨大的社会价值。连接第一，占有不重要，高效连接有用，这是互联网给世界带来的最大改变。

所有连接都需要通过介质。互联网是通过PC、手机、智能硬件、汽车等，它扩展了你的能力，让人们与世界更加紧密地联系在一起。这里有两个关键问题需要解决：人类如何以自然的方式与机器交互？机器如何更好地索引世界并与人交朋友？两者背后的支持都是大数据。

在交互领域，诞生了世界上最伟大的公司：苹果。在连接人与世界的链条中，从键盘、鼠标、触控、语音、手势，苹果让人与机器的距离更近了。那么，未来交互的最终形式是什么？它是心灵感应，脑机交互。

在索引领域，诞生了世界上最伟大的公司：谷歌，市值5000亿美元。索引的趋势是：从无序到有序，使非结构化信息变得有序，便于人们获取；从数据到语义，方便人们了解数据背后的内容；从线下到线上，检索虚拟信息、商品信息、线下服务信息。

这一切其实都与机器的进化有关，即：从个人电脑时代到智能手机，再分化为智能硬件，最终的趋势是“智能助手”的概念，它可以帮你完成很多事情，就像你真正的助手一样，为你管理一切。

那么未来会怎样？连接人与世界，完整的交互与索引，人与机器完全融合，没有距离，机器变成了机器人（计算机控制下具有自主行为的机器），它完全明白你此刻在想什么，然后自主完成你想做的事情。当然，这需要无处不在的传感器和强大的计算能力。

我经常被问到一个问题：当机器变得聪明时，它们会成为对人类的威胁吗？我回答说，它有可能在很多方面超过人类。比如对于机器来说，学习是瞬时的，只需要光纤网络传输，我想把我的知识传授给我的朋友。他需要很长时间才能真正理解，但机器可以立即制造出来，可以复制知识，交换知识，未来真的会对人类构成真正的威胁。

我认为只有一种救赎方式。唯一的机会就是在交互上取得突破性进展，让人机交互实现零距离。如果是这样，那么你也可以拥有机器功能，比如将小芯片放入你的体内。

如何在交互上取得突破性进展？让我们来看看当今人类在科技方面取得的一些成就。

关于强人工智能的哲学思考

什么是人工智能技术？人工智能发生了多远？日前，在国家会议中心举办了一场机器人大会。机器人看起来像人，栩栩如生。那么，人工智能究竟可以实现什么？什么是早产？我们有什么不用担心的？今天的人工智能处于起步阶段，处于“润物细无声”、“毛毛细雨”的状态，但我们仍隐约能听到雷鸣般的轰鸣声。

我有时想知道如果人类是月球上唯一的生物，为什么不是其他物种？那是因为我们有非凡的大脑。这就是为什么我们如此痴迷于自己的奥秘，所以我们想知道：是否有可能通过数学和技术来复制人类非凡的大脑和智能，这也是人工智能的魅力所在。从整个信息技术的发展来看，从信息论到图灵测试，再到通信技术的发展，再到计算机信息科学，一切的发展归根结底都是为了一件事：我们能不能让机器拥有智能功能？

那么，什么是人工智能？一是具有感知能力，身上带有传感器，可以感知环境的变化；二是领悟，从感知阶段上升到对世界的领悟；三是决策，通过从世界获得的信号上升到理解做出决策。

其实搜索引擎也是一个人工智能系统，因为它有一个非常精细的结构：

它具有感知能力。借助免费服务，用户正在向搜索引擎提供数据，因此真实信息不断分层，即显性信息（在社交媒体上发布）、部分信息（在特定地点分享）、私人信息。互联网最成熟的商业模式之一就是利用用户信息来实现商业价值。正因为用户的理解足够正确，才能推出符合用户现状的广告或产品。中间有一个强大的系统，而基于大数据的人工智能系统搭起了一座桥梁，所以无论是搜索引擎还是“Wall-E”机器人，都具有典型人工智能的几个方面。

说到人工智能，我们都看到了一个浪漫的观点，那就是“强人工智能”，即拥有与人类相同的智能，具有很强的学习能力。图灵测试是由伟大的科学家图灵提出的。他如何定义“强人工智能”？他说，如果现在有一块布，你不知道幕后是机器人还是人，如果你看不出来，对方有很强的人工智能。

微软小冰（微软的人工智能伴侣虚拟机器人）做的不错，但多说几句，你会发现小冰系统更擅长噱头，严肃的对话很难进行。现在我们会看到很多通过图灵测试的报告。事实上，它们都是无稽之谈。我们今天的算法远非真正意义上的“强人工智能”。

另一种观点认为，机器人具有部分人工智能，我们称之为“弱人工智能”，可以在不确定的环境中做某事。具有部分智能的机器人是当前行业的主流观点。只要它们能产生真正的智能，它们就是有价值的。

人们经常热衷于对人工智能是什么进行哲学推测。历史上有一个著名的讨论叫“思想实验”，讲的是：一个房间关着一个对中国一无所知的英国人，然后房间里的桌子上放着一本书让他知道，就在这个时候，从门外传来了一张英文字条，让他在魔法书里念出来，写一个中文译本。结果，他写了。这看起来很聪明计算机能直接识别的语言是，但是这个英国人不懂中文。他写作和翻译这种外表的行为是他真正的智慧吗？表现在行为中的智慧并不是真正的智慧。我个人比较认同另一个答案，就是这个英国人不懂中文，但是“英国人+书+房间”，这个系统很智能。

什么是机器人？我们把它翻译成中文的机器人，我认为这个翻译有误导性，不够准确。剑桥词典的翻译是：“在计算机控制下具有自主行为的机器”。让我们再看看Android。它的意思是：“一个长得像人的机器人”，也就是Android应该翻译成机器人。什么是机器人？什么是普通机器？

根据确定性和固定程序进行操作。具有一致性的产品就是机器。在传感器的引导下能够感知和适应不确定环境的机器就是机器人。它有一个很大的市场，有大量的公司有很大的市值。工业4.0会讲C2M（customer to factory），用户的个性化订单直接体现在工厂生产中，每件商品的背后都是具体的用户订单需求，这种情况下需要强大的机器人流水线.

在大城市，您总是面临不确定的车辆状况。如果一台机器可以自主驾驶，捕捉不确定环境中的瞬时变化，然后转化为对路况的理解，进而形成控制决策，这就是机器人，那么机器人需要看起来像人吗？我们面临的机器人行业非常广泛。

1956 年，人工智能这个词诞生了。当时，科技领域的先驱们召开了人工智能大会，提出了非常有远见的思考：如何让机器模拟，实现智能？当然，他们的想法并不是最早的，最早可以追溯到莱布尼茨，他首先提出通过数据计算智能。

这些圣人不仅有远见，而且还过于乐观地认为智能的根本问题可以在一个夏天解决，但它解决了吗？不。维基百科条目“AI 冬天”列出了很多失败案例。为什么它在50、60年间激起了人们如此大的热情，却没有产生我们期待的道路？

过去的大部分AI系统推演得都比较科学。演绎的概念类似于“一命二二三三事”，从一个基本规律出发，演绎出一个复杂的系统（归纳是从复杂的世界中提取出简单的规律。过去的自然科学，都是从不言自明的公理出发，比如相信上帝创造了人，但从这种思维出发会导致人工智能过于简单）。传统的基于规则的人工智能系统已经没有结果，形成了许多教训：

第一课：世界是复杂的，有很多因素和要素，相互之间有着复杂的影响，形成复杂的网络和系统，难以用公式来描述；

第 2 课：有很多因素和参数是你无法观察到的，因此系统具有不确定性。现实是用概率运行的，如果你用确定性的规则，那么复杂的系统是没有办法掌握的，我们必须使用基于统计的概念；

第 3 课：现实世界是复杂的，你很难完全描述哪里，本质上，数据为我们提供了理解世界的可能性。随着数据的发展，学习能力是关键。

我认为过去 60 年的人工智能总结是这样的：基于规则的系统统治了过去的人工智能时代。现在需要进入一个数据驱动的系统，将数据导入机器，机器通过消化吸收生成世界认知的模型。

让我们讨论一些基本的 AI 问题，并将它们归结为最简单的形式：通过观察到的现象、数据和知识，将它们映射到预测和判断。比如输入一张图片，然后输出“物体”的名称，这个映射就是图像识别；你输入一个语音信号，然后输出“文本序列”，这就是语音识别；你输入一个段落，然后输出“解析的“树状结构”，即自然云存储；你输入车辆行驶周围路况的情况，然后输出“控制决策”，即自动驾驶。

我们面临的很多问题是：如何从数据中学习映射函数来形成训练样本？例如，当多张图片被定义为“长颈鹿”的标签时，系统通过训练进行学习，然后当给出相似的新图片时，该图片也可以自动打上这个标签。

除非你做出假设，否则不可能从有限中推导出无限。没有假设，就无法做出判断。古人的智慧说“亲朱者赤，亲墨者黑”，寓意简单的智慧，即判断时，要有隐含的假设。：两个人在某些方面相似，在其他方面具有相似的特征和特点。

这反映了人工智能大数据学习的本质问题：假设的合理性。我们希望从数据中得出的结论简单流畅，不复杂，所以哲学中有一个词汇：剃刀原理，即在可以同时解释一个现象的几个定律中，我们喜欢选择其中最简单的规则。总而言之，我们希望能够找到一种既能找到观察样本又能产生简单结果的模式。

如何从复杂样本中提取规则？最擅长的是人脑，能够三、持续学习。这种学习中最简单的单元是神经元，它有许多神经簇并与其他神经元相连。神经元接收到外界信息输入后，对信息信号的反应通过神经末梢传递给其他神经元。

这个结构可以用一个简单的数学公式来描述：感知器模型，基于单个神经元构建一个具有学习能力的人工智能系统，它像一个神经元一样，从外界获取输入并传递给中央处理的地方，通过简单的操作输出。

今天，这个简单的模型正在向多个维度扩展，即从线性输入和输出，到深度神经网络，最后到具有学习能力的人工智能系统。

为什么要认真对待深度学习？

我们最近经常听到“深度学习”，它在谷歌、微软、Facebook、百度等最大的互联网公司中运行，产生了巨大的商业价值。它使自动驾驶和其他过去难以想象的事情成为现实。事情变得触手可及。为什么要认真对待这种技术？

1、模拟人脑的层次结构和行为

我们今天发现了基于视觉的神经网络（科学家在研究过程中受到大脑内视觉信息的分层表示的启发。随着视觉输入从视网膜流向初级视觉皮层再到颞下皮层, 在识别物体之前计算机能直接识别的语言是，对每一层进行处理以准确识别物体），因此可以用数据训练系统，以反映视觉神经网络的结构和行为。为了模拟这个过程，神经网络的设计者在模型中设计了几层计算。一开始，最底层的神经元对颜色不敏感，但对边界和方向敏感。可以还原物体的轮廓，将轮廓提取出来，上层的神经元有一些更有趣的行为，对物体的部分非常敏感，上层的神经元开始对物体敏感，这是一个逐层，从局部到整体敏感的过程。这就是视觉网络根据数据的行为方式。

在听觉神经系统中也有类似的现象，我们通过数据的深度训练也得到了类似的结果。

2、深度学习特别适合大数据

过去的模型和方法不适合大数据处理。通常，我们通过泛化误差测试来衡量模型的质量。找出原因并通过泛化误差来控制它，从而找到更好的学习方法。促销错误来自几个方面：

其中一个来源是对模型做出假设，但模型假设并不完美，所以肯定有错误。概率统计中有句名言：你所有的模型都是错的，但有些模型是有用的；

第二个来源是不完善的数据、有限的样本、噪音或偏差。这两个缺陷都会引入错误，因为典型的统计类别忽略了一点：假设计算资源无限，这是第三个来源。计算机科学做的是实际问题，会导致不完美的计算和错误，所以你应该尽量让你的假设完美，让你的假设足够广泛，收集大量数据，并寻求算法来处理大数据。

传统的人工智能算法无法处理更大规模的数据，因为如果算法的复杂度与样本呈立方关系，当计算机设备的数量与样本增加同一个立方时，就意味着数据增加，算法更高效。这就是为什么要重视深度学习，它特别适应大数据，数据越大，算法越好。

3、深度学习是一种灵活的建模语言

如何写好文章就如同如何做一个好的人工智能系统一样，即要有足够的灵活性来控制语言，需要对生活和面临的问题有深刻的洞察和思考，灵活只有建模语言和内在洞察力才能做好。

深度学习是历史上第一个端到端的学习。无论是语音识别还是从感知、预处理到预测判断，过去的大部分工作都是做最后一部分，而没有完成前一部分。几个动作。从计算的角度来看，在深度学习之前，上述步骤都是消耗计算资源的，都是人工的，但是深度学习是一次性完成的，减少了人工。这种变化是革命性的，已经成为今天的共识。

4、深度学习的成功应用

我们来看看一些成功的应用，比如计算机领域的图像识别，从最原始的输入图像开始，然后在中间不断地提取数据、变换、训练。

Image Net 是一个计算机视觉系统识别项目，是目前世界上最大的图像识别数据库。 2010年以来，其水平不断提高。最大的进步出现在 2012 年，随着深度学习的引入带来了巨大的进步，但计算机真的比人类更聪明吗？不，它比普通人认可的多，但绝对不比专业人士强。它绝对不比人聪明。计算机在一件事情上优化了一件事情，但并不代表它就比整个人强。

如今，技术可以识别非常潦草的手写电话号码、任意方向的文本检测、人脸识别（例如基于深度学习的人脸识别技术：百度魔图），甚至自动驾驶等更严重的事情。现在很多公司都在做自动驾驶，听起来很科幻，但是这个行业发展很快。

汽车有两大趋势：新能源和智能化。这两种趋势势不可挡，汽车也变成了机器人。视觉处理尤为重要。为了安全，最重要的是应对未知，做到全方位感知，预见形势。

语音识别也是另一个应用。目前，句子的理解率在 75% 左右。如果能达到90%，那是非常可怕的。从声速特征、语言特征到最终的文本识别结果，为什么近年来语音识别发展迅速？这是因为在前端植入语音神经网络的一次小小的尝试，使语音识别变得可用，彻底改变了。基于深度学习的语音识别可用于地图导航、输入法和移动搜索。

如何理解自然语言？传统的做法是将大问题分解成独立的子问题，分别进行分析。现在的新系统是用一个完整的深度学习模型，可以解释句子的语义相关性，从而训练一个对话系统，我们可以训练一个与好莱坞人物的对话系统。我们甚至可以将语言和视觉结合起来，因为我们对世界的认知是在语言认知和视觉认知中同时发展的。今天的计算机也可以在看到图片时开始生成语言文本，从而可以同时理解图像和自然语言。

在某些场景下，云处理是不够的。人工智能发展的未来趋势是其前端部署偏向感知，后端偏向大数据认知，比如自动驾驶。周围200米范围内的一举一动，都是由前端传感器感知决定的。 5公里以外的情况是通过云端大数据分析获取知识，从而形成前后端结合。

回到问题：人脑是通用处理器吗？从猴子到人类，人类之所以能够从现在的物种中脱颖而出，是因为大脑在不断优化人类需要的特殊能力。此外，大脑也不擅长。本质上，大脑是一个专用处理器，而不是通用处理器。

大脑计算速度很慢，但一个人怎么会开车打乒乓球呢？因为这些问题的处理速度加快。为什么我们今天处理得这么好？因为我们在结构上做了特殊的优化。

我们现在做的 Horizon Robotics 技术是帮助机器人开发特殊的处理器。我们希望把它的性能提升1000倍，希望硬件能够支持这样的应用，让效果更好。

智慧不等于智慧

人工智能的大规模应用伴随着互联网的发展。前10年（2000-2009），是“润物无声”的时代。最大的应用在于PC互联网，如搜索、广告、推荐等。

在我们目前（2010-2019）的10年里，语音、图像、语音、机器人操作都取得了飞速发展。同时，它们也在改造传统产业，越来越被人们所认知。 “在寂静处听雷”的时代。

接下来的10年（2020-2029）将是一个非常灿烂的时代，一个“国之美”、互动无处不在的时代。会被取代，机器做什么，让机器做什么，人做什么是人做的。简单重复的工作需要解放。从万物互联到万物智能，数据成为商品。我们不需要太担心机器，2029年的机器没有好奇心，没有情绪，没有自我意识。

我的结论是：智慧不等于智慧。我认为未来从万物互联到万物智能有三大趋势：所有设备都有智能传感器，所有设备都联网，所有设备都连接到人和服务。所有设备最终都会成为一个通用的机器人系统：感知、理解、决策。

伟大的技术不是让机器变得更伟大，而是让每个普通人变得更伟大。

本文转载自：杨建勇，授权于凯第一期：笔记本人活动：颠覆性创新工场

（杨建勇：创意物联网创始人，物联网资深人士）

文章版权声明 1、本站永久网址：https://www.9im.cn
2、本主题所有言论和图片纯属会员个人意见，与本网站立场无关。
3、本网站所有源码和软件均为作者提供和网友推荐收集整理而来，对提供的源码不拥有任何权利，其版权归原著者拥有。仅供学习和研究使用,下载后请24小时内删除。不得使用于非法商业用途，不得经营非法游戏或违反国家法律。一切关于该资源商业行为与老王博客无关。
4、如果您喜欢该程序，请支持正版源码、软件，购买注册，得到更好的正版服务。如有侵犯你版权的，请邮件与我们联系处理，本站将立即改正。
5、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

喜欢就支持一下吧