互联网改变了什么?机器如何更好地索引世界

文/于凯

随着互联网时代的到来,人类科技的发展必然会带来一定的便利,但一旦机器变得比人类更聪明,除了人类灵性的大幅提升,还能有什么解决方案呢?我在互联网上工作了这么久,让我们看看互联网发生了哪些变化?

互联网发生了哪些变化?

互联网的本质就像微信打开时的画面,蕴含着深刻的哲学思想:纷繁复杂的世界,我们与世界的关系是什么?为了解决这个问题,孔子提出了“仁”,宗教提出了“世界的另一边”,互联网提出了“人与世界的连接”。连接人和世界时,包括连接人和信息(如百度)、连接人和商品(如亚马逊、淘宝)、连接人和连接人(如微信)、连接人和服务(如滴滴、优步),从而孕育了大的产业机会,发生了很多大事,产生了巨大的社会价值。连接第一,占有不重要,高效连接有用,这是互联网给世界带来的最大改变。

所有连接都需要通过介质。互联网是通过PC、手机、智能硬件、汽车等,它扩展了你的能力,让人们与世界更加紧密地联系在一起。这里有两个关键问题需要解决:人类如何以自然的方式与机器交互?机器如何更好地索引世界并与人交朋友?两者背后的支持都是大数据。

在交互领域,诞生了世界上最伟大的公司:苹果。在连接人与世界的链条中,从键盘、鼠标、触控、语音、手势,苹果让人与机器的距离更近了。那么,未来交互的最终形式是什么?它是心灵感应,脑机交互。

在索引领域,诞生了世界上最伟大的公司:谷歌,市值5000亿美元。索引的趋势是:从无序到有序,使非结构化信息变得有序,便于人们获取;从数据到语义,方便人们了解数据背后的内容;从线下到线上,检索虚拟信息、商品信息、线下服务信息。

这一切其实都与机器的进化有关,即:从个人电脑时代到智能手机,再分化为智能硬件,最终的趋势是“智能助手”的概念,它可以帮你完成很多事情,就像你真正的助手一样,为你管理一切。

那么未来会怎样?连接人与世界,完整的交互与索引,人与机器完全融合,没有距离,机器变成了机器人(计算机控制下具有自主行为的机器),它完全明白你此刻在想什么,然后自主完成你想做的事情。当然,这需要无处不在的传感器和强大的计算能力。

我经常被问到一个问题:当机器变得聪明时,它们会成为对人类的威胁吗?我回答说,它有可能在很多方面超过人类。比如对于机器来说,学习是瞬时的,只需要光纤网络传输,我想把我的知识传授给我的朋友。他需要很长时间才能真正理解,但机器可以立即制造出来,可以复制知识,交换知识,未来真的会对人类构成真正的威胁。

我认为只有一种救赎方式。唯一的机会就是在交互上取得突破性进展,让人机交互实现零距离。如果是这样,那么你也可以拥有机器功能,比如将小芯片放入你的体内。

如何在交互上取得突破性进展?让我们来看看当今人类在科技方面取得的一些成就。

关于强人工智能的哲学思考

什么是人工智能技术?人工智能发生了多远?日前,在国家会议中心举办了一场机器人大会。机器人看起来像人,栩栩如生。那么,人工智能究竟可以实现什么?什么是早产?我们有什么不用担心的?今天的人工智能处于起步阶段,处于“润物细无声”、“毛毛细雨”的状态,但我们仍隐约能听到雷鸣般的轰鸣声。

我有时想知道如果人类是月球上唯一的生物,为什么不是其他物种?那是因为我们有非凡的大脑。这就是为什么我们如此痴迷于自己的奥秘,所以我们想知道:是否有可能通过数学和技术来复制人类非凡的大脑和智能,这也是人工智能的魅力所在。从整个信息技术的发展来看,从信息论到图灵测试,再到通信技术的发展,再到计算机信息科学,一切的发展归根结底都是为了一件事:我们能不能让机器拥有智能功能?

那么,什么是人工智能?一是具有感知能力,身上带有传感器,可以感知环境的变化;二是领悟,从感知阶段上升到对世界的领悟;三是决策,通过从世界获得的信号上升到理解做出决策。

其实搜索引擎也是一个人工智能系统,因为它有一个非常精细的结构:

它具有感知能力。借助免费服务,用户正在向搜索引擎提供数据,因此真实信息不断分层,即显性信息(在社交媒体上发布)、部分信息(在特定地点分享)、私人信息。互联网最成熟的商业模式之一就是利用用户信息来实现商业价值。正因为用户的理解足够正确,才能推出符合用户现状的广告或产品。中间有一个强大的系统,而基于大数据的人工智能系统搭起了一座桥梁,所以无论是搜索引擎还是“Wall-E”机器人,都具有典型人工智能的几个方面。

说到人工智能,我们都看到了一个浪漫的观点,那就是“强人工智能”,即拥有与人类相同的智能,具有很强的学习能力。图灵测试是由伟大的科学家图灵提出的。他如何定义“强人工智能”?他说,如果现在有一块布,你不知道幕后是机器人还是人,如果你看不出来,对方有很强的人工智能。

微软小冰(微软的人工智能伴侣虚拟机器人)做的不错,但多说几句,你会发现小冰系统更擅长噱头,严肃的对话很难进行。现在我们会看到很多通过图灵测试的报告。事实上,它们都是无稽之谈。我们今天的算法远非真正意义上的“强人工智能”。

另一种观点认为,机器人具有部分人工智能,我们称之为“弱人工智能”,可以在不确定的环境中做某事。具有部分智能的机器人是当前行业的主流观点。只要它们能产生真正的智能,它们就是有价值的。

人们经常热衷于对人工智能是什么进行哲学推测。历史上有一个著名的讨论叫“思想实验”,讲的是:一个房间关着一个对中国一无所知的英国人,然后房间里的桌子上放着一本书让他知道,就在这个时候,从门外传来了一张英文字条,让他在魔法书里念出来,写一个中文译本。结果,他写了。这看起来很聪明计算机能直接识别的语言是,但是这个英国人不懂中文。他写作和翻译这种外表的行为是他真正的智慧吗?表现在行为中的智慧并不是真正的智慧。我个人比较认同另一个答案,就是这个英国人不懂中文,但是“英国人+书+房间”,这个系统很智能。

什么是机器人?我们把它翻译成中文的机器人,我认为这个翻译有误导性,不够准确。剑桥词典的翻译是:“在计算机控制下具有自主行为的机器”。让我们再看看Android。它的意思是:“一个长得像人的机器人”,也就是Android应该翻译成机器人。什么是机器人?什么是普通机器?

根据确定性和固定程序进行操作。具有一致性的产品就是机器。在传感器的引导下能够感知和适应不确定环境的机器就是机器人。它有一个很大的市场,有大量的公司有很大的市值。工业4.0会讲C2M(customer to factory),用户的个性化订单直接体现在工厂生产中,每件商品的背后都是具体的用户订单需求,这种情况下需要强大的机器人流水线.

在大城市,您总是面临不确定的车辆状况。如果一台机器可以自主驾驶,捕捉不确定环境中的瞬时变化,然后转化为对路况的理解,进而形成控制决策,这就是机器人,那么机器人需要看起来像人吗?我们面临的机器人行业非常广泛。

1956 年,人工智能这个词诞生了。当时,科技领域的先驱们召开了人工智能大会,提出了非常有远见的思考:如何让机器模拟,实现智能?当然,他们的想法并不是最早的,最早可以追溯到莱布尼茨,他首先提出通过数据计算智能。

这些圣人不仅有远见,而且还过于乐观地认为智能的根本问题可以在一个夏天解决,但它解决了吗?不。维基百科条目“AI 冬天”列出了很多失败案例。为什么它在50、60年间激起了人们如此大的热情,却没有产生我们期待的道路?

过去的大部分AI系统推演得都比较科学。演绎的概念类似于“一命二二三三事”,从一个基本规律出发,演绎出一个复杂的系统(归纳是从复杂的世界中提取出简单的规律。过去的自然科学,都是从不言自明的公理出发,比如相信上帝创造了人,但从这种思维出发会导致人工智能过于简单)。传统的基于规则的人工智能系统已经没有结果,形成了许多教训:

第一课:世界是复杂的,有很多因素和要素,相互之间有着复杂的影响,形成复杂的网络和系统,难以用公式来描述;

第 2 课:有很多因素和参数是你无法观察到的,因此系统具有不确定性。现实是用概率运行的,如果你用确定性的规则,那么复杂的系统是没有办法掌握的,我们必须使用基于统计的概念;

第 3 课:现实世界是复杂的,你很难完全描述 哪里,本质上,数据为我们提供了理解世界的可能性。随着数据的发展,学习能力是关键。

我认为过去 60 年的人工智能总结是这样的:基于规则的系统统治了过去的人工智能时代。现在需要进入一个数据驱动的系统,将数据导入机器,机器通过消化吸收生成世界认知的模型。

让我们讨论一些基本的 AI 问题,并将它们归结为最简单的形式:通过观察到的现象、数据和知识,将它们映射到预测和判断。比如输入一张图片,然后输出“物体”的名称,这个映射就是图像识别;你输入一个语音信号,然后输出“文本序列”,这就是语音识别;你输入一个段落,然后输出“解析的“树状结构”,即自然云存储;你输入车辆行驶周围路况的情况,然后输出“控制决策”,即自动驾驶。

我们面临的很多问题是:如何从数据中学习映射函数来形成训练样本?例如,当多张图片被定义为“长颈鹿”的标签时,系统通过训练进行学习,然后当给出相似的新图片时,该图片也可以自动打上这个标签。

除非你做出假设,否则不可能从有限中推导出无限。没有假设,就无法做出判断。古人的智慧说“亲朱者赤,亲墨者黑”,寓意简单的智慧,即判断时,要有隐含的假设。 :两个人在某些方面相似,在其他方面具有相似的特征和特点。

这反映了人工智能大数据学习的本质问题:假设的合理性。我们希望从数据中得出的结论简单流畅,不复杂,所以哲学中有一个词汇:剃刀原理,即在可以同时解释一个现象的几个定律中,我们喜欢选择其中最简单的规则。总而言之,我们希望能够找到一种既能找到观察样本又能产生简单结果的模式。

图片[1]-互联网改变了什么?机器如何更好地索引世界-老王博客

如何从复杂样本中提取规则?最擅长的是人脑,能够三、持续学习。这种学习中最简单的单元是神经元,它有许多神经簇并与其他神经元相连。神经元接收到外界信息输入后,对信息信号的反应通过神经末梢传递给其他神经元。

这个结构可以用一个简单的数学公式来描述:感知器模型,基于单个神经元构建一个具有学习能力的人工智能系统,它像一个神经元一样,从外界获取输入并传递给中央处理的地方,通过简单的操作输出。

今天,这个简单的模型正在向多个维度扩展,即从线性输入和输出,到深度神经网络,最后到具有学习能力的人工智能系统。

为什么要认真对待深度学习?

我们最近经常听到“深度学习”,它在谷歌、微软、Facebook、百度等最大的互联网公司中运行,产生了巨大的商业价值。它使自动驾驶和其他过去难以想象的事情成为现实。事情变得触手可及。为什么要认真对待这种技术?

1、模拟人脑的层次结构和行为

我们今天发现了基于视觉的神经网络(科学家在研究过程中受到大脑内视觉信息的分层表示的启发。随着视觉输入从视网膜流向初级视觉皮层再到颞下皮层, 在识别物体之前计算机能直接识别的语言是,对每一层进行处理以准确识别物体),因此可以用数据训练系统,以反映视觉神经网络的结构和行为。为了模拟这个过程,神经网络的设计者在模型中设计了几层计算。一开始,最底层的神经元对颜色不敏感,但对边界和方向敏感。可以还原物体的轮廓,将轮廓提取出来,上层的神经元有一些更有趣的行为,对物体的部分非常敏感,上层的神经元开始对物体敏感,这是一个逐层,从局部到整体敏感的过程。这就是视觉网络根据数据的行为方式。

在听觉神经系统中也有类似的现象,我们通过数据的深度训练也得到了类似的结果。

2、深度学习特别适合大数据

过去的模型和方法不适合大数据处理。通常,我们通过泛化误差测试来衡量模型的质量。找出原因并通过泛化误差来控制它,从而找到更好的学习方法。促销错误来自几个方面:

其中一个来源是对模型做出假设,但模型假设并不完美,所以肯定有错误。概率统计中有句名言:你所有的模型都是错的,但有些模型是有用的;

第二个来源是不完善的数据、有限的样本、噪音或偏差。这两个缺陷都会引入错误,因为典型的统计类别忽略了一点:假设计算资源无限,这是第三个来源。计算机科学做的是实际问题,会导致不完美的计算和错误,所以你应该尽量让你的假设完美,让你的假设足够广泛,收集大量数据,并寻求算法来处理大数据。

传统的人工智能算法无法处理更大规模的数据,因为如果算法的复杂度与样本呈立方关系,当计算机设备的数量与样本增加同一个立方时,就意味着数据增加,算法更高效。这就是为什么要重视深度学习,它特别适应大数据,数据越大,算法越好。

3、深度学习是一种灵活的建模语言

如何写好文章就如同如何做一个好的人工智能系统一样,即要有足够的灵活性来控制语言,需要对生活和面临的问题有深刻的洞察和思考,灵活只有建模语言和内在洞察力才能做好。

深度学习是历史上第一个端到端的学习。无论是语音识别还是从感知、预处理到预测判断,过去的大部分工作都是做最后一部分,而没有完成前一部分。几个动作。从计算的角度来看,在深度学习之前,上述步骤都是消耗计算资源的,都是人工的,但是深度学习是一次性完成的,减少了人工。这种变化是革命性的,已经成为今天的共识。

4、深度学习的成功应用

我们来看看一些成功的应用,比如计算机领域的图像识别,从最原始的输入图像开始,然后在中间不断地提取数据、变换、训练。

Image Net 是一个计算机视觉系统识别项目,是目前世界上最大的图像识别数据库。 2010年以来,其水平不断提高。最大的进步出现在 2012 年,随着深度学习的引入带来了巨大的进步,但计算机真的比人类更聪明吗?不,它比普通人认可的多,但绝对不比专业人士强。它绝对不比人聪明。计算机在一件事情上优化了一件事情,但并不代表它就比整个人强。

如今,技术可以识别非常潦草的手写电话号码、任意方向的文本检测、人脸识别(例如基于深度学习的人脸识别技术:百度魔图),甚至自动驾驶等更严重的事情。现在很多公司都在做自动驾驶,听起来很科幻,但是这个行业发展很快。

汽车有两大趋势:新能源和智能化。这两种趋势势不可挡,汽车也变成了机器人。视觉处理尤为重要。为了安全,最重要的是应对未知,做到全方位感知,预见形势。

语音识别也是另一个应用。目前,句子的理解率在 75% 左右。如果能达到90%,那是非常可怕的。从声速特征、语言特征到最终的文本识别结果,为什么近年来语音识别发展迅速?这是因为在前端植入语音神经网络的一次小小的尝试,使语音识别变得可用,彻底改变了。基于深度学习的语音识别可用于地图导航、输入法和移动搜索。

如何理解自然语言?传统的做法是将大问题分解成独立的子问题,分别进行分析。现在的新系统是用一个完整的深度学习模型,可以解释句子的语义相关性,从而训练一个对话系统,我们可以训练一个与好莱坞人物的对话系统。我们甚至可以将语言和视觉结合起来,因为我们对世界的认知是在语言认知和视觉认知中同时发展的。今天的计算机也可以在看到图片时开始生成语言文本,从而可以同时理解图像和自然语言。

在某些场景下,云处理是不够的。人工智能发展的未来趋势是其前端部署偏向感知,后端偏向大数据认知,比如自动驾驶。周围200米范围内的一举一动,都是由前端传感器感知决定的。 5公里以外的情况是通过云端大数据分析获取知识,从而形成前后端结合。

回到问题:人脑是通用处理器吗?从猴子到人类,人类之所以能够从现在的物种中脱颖而出,是因为大脑在不断优化人类需要的特殊能力。此外,大脑也不擅长。本质上,大脑是一个专用处理器,而不是通用处理器。

大脑计算速度很慢,但一个人怎么会开车打乒乓球呢?因为这些问题的处理速度加快。为什么我们今天处理得这么好?因为我们在结构上做了特殊的优化。

我们现在做的 Horizo​​n Robotics 技术是帮助机器人开发特殊的处理器。我们希望把它的性能提升1000倍,希望硬件能够支持这样的应用,让效果更好。

智慧不等于智慧

人工智能的大规模应用伴随着互联网的发展。前10年(2000-2009),是“润物无声”的时代。最大的应用在于PC互联网,如搜索、广告、推荐等。

在我们目前(2010-2019)的10年里,语音、图像、语音、机器人操作都取得了飞速发展。同时,它们也在改造传统产业,越来越被人们所认知。 “在寂静处听雷”的时代。

接下来的10年(2020-2029)将是一个非常灿烂的时代,一个“国之美”、互动无处不在的时代。会被取代,机器做什么,让机器做什么,人做什么是人做的。简单重复的工作需要解放。从万物互联到万物智能,数据成为商品。我们不需要太担心机器,2029年的机器没有好奇心,没有情绪,没有自我意识。

我的结论是:智慧不等于智慧。我认为未来从万物互联到万物智能有三大趋势:所有设备都有智能传感器,所有设备都联网,所有设备都连接到人和服务。所有设备最终都会成为一个通用的机器人系统:感知、理解、决策。

伟大的技术不是让机器变得更伟大,而是让每个普通人变得更伟大。

本文转载自:杨建勇,授权于凯第一期:笔记本人活动:颠覆性创新工场

(杨建勇:创意物联网创始人,物联网资深人士)

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论