如何让AI给出地道而不是的应用?(上)

近年来,随着人工智能的兴起,神经网络一词也出现在了人们的视线中。事实上,神经网络并不是一个新名词。

早在 70 多年前,神经网络就已被 AI 前沿的工作人员用来探索人脑的工作模式——人脑中数十亿个神经元相互连接,形成一个负责处理的错综复杂的生物神经网络。各种感官。数据,并做出相应的压力反应,以便我们从不断尝试的反馈中总结经验,获取新知识。同样,人工智能中的“神经网络”通过相互连接的不同层对大量数据进行过滤和处理,并通过自我学习,做出相应的预测或模式识别。

由于其在人工智能中的决定性作用以及在面对各种棘手问题时几乎无所不能的潜力,神经网络被吹捧为“无所不能”。

其中,最具代表性的问题是模式识别。或许你没听说过这个名词,但你一定熟悉很多模式识别衍生出来的强大应用:比如如何让AI给出真实而不是死板的翻译,如何让手机相册自动识别和标记照片游戏中反复出现的面孔,甚至让AI学会下围棋、打败世界冠军等等,都离不开模式识别技术的强大助推。

模式识别,是通过计算机技术自动或半自动(人机交互)实现人的识别过程。在这里,模式定义如下:为了让机器执行识别任务,必须首先将关于要识别的对象的有用信息输入计算机。为此,必须对识别对象进行抽象,建立其数学模型来描述和替换识别对象。

模式识别是指对表示事物或现象的各种形式的(数字、文本和逻辑关系)信息进行处理和分析,以描述、识别、分类和解释事物或现象的过程。科学和人工智能的重要组成部分。

模式识别主要包括两种方法:

1.数学统计方法。统计方法是发展较早的方法,也是应用最广泛的方法。是将处理后的对象数字化,转换成计算机可以分析识别的数字信息,提取样本的特征值,将输入模式从对象空间映射到特征空间。这样,模式就可以用特征空间中的一个点或一个特征向量来表示。

2.语法方法。其基本思想是将一个模式描述为更简单的子模式的组合,子模式可以描述为更简单的子模式的组合,最终得到树状结构描述。底部最简单的子模式称为模式原语。其基本思想是将一个模式描述为更简单的子模式的组合,子模式可以描述为更简单的子模式的组合,最终得到树状结构描述。底部最简单的子模式称为模式原语。

然而,当面对高级数字中的复杂数学符号(例如微积分中的积分或常微分方程计算)时,看似强大且范围广泛的模式识别却令人望而生畏。

通过对上述模式识别方法的分析,我们可以简单地推断,神经网络在解决数学问题上的主要障碍来自于数学问题的本质——数学需要准确的答案,而神经网络对信息很敏感。的处理方面更擅长概率。

他们经常在给定大量数据的情况下进行模式识别——例如,在翻译时,给定各种可能的翻译,以确定哪个翻译更接地气;或者给定不同的照片,标记人脸,比较相似度,圈出出现概率高的人脸——并根据这些高概率出现的结果,总结出最可能的模式,并将这个模式定义为新的模式。以高发生概率对未来事件做出可能的预测。

解决数学问题的新方法 – 语言翻译

当然,快速发展、不断改进的神经网络不允许它在数学问题中长期存在缺陷。去年年底,来自 Facebook 人工智能研究小组的两位计算机科学家 Guillaume Lample 和 Francois Charton 成功探索了一种使用神经网络解决符号数学问题的方法。

开发的功能强大的新程序利用了神经网络的主要优势之一:它可以改进自己的隐含规则。

斯坦福大学心理学家 Jay McClelland 曾经说过:“规则和例外没有区别。” 人们在不断尝试“例外”的过程中,可以学习总结出解决类似问题的一般规律,并将这个一般规律视为“规则”,用“规则”解决更多的“例外”。在不断解决“例外”的过程中,“规则”也会不断完善。

而程序构建的神经网络只是模拟了人们学习数学时“规则”和“例外”之间不断转换的模式。这意味着程序在解决问题时不会遇到最难的点,而是在解决常规问题时总结出一套“规则”,在遇到更难的问题时会派上用场。

理论上,神经网络或许能够推导出不同于数学家的“规则”。这就像AlphaGo Zero,和自己玩了三天三夜,秒杀了人类围棋高手。

值得一提的是,他们的方法不涉及数字运算或数值逼近。相反,他们将复杂的数学问题重新排列成神经网络的工作:语言翻译。

传统计算机非常擅长处理数字。计算机的代数系统就是将几十个或几百个算法和预设指令捆绑在一起,而计算机则根据指令一步一步地运行,执行预设的特定操作。一旦偏离程序,计算机只能被解除武装并投降。但是对于许多符号问题,它们产生的数值解非常接近工程和物理学中的实际应用。

另一方面,神经网络没有固定的规则。相反,他们可以在海量数据集上进行训练——越大越好——并使用训练中的统计数据来获得数值解的良好近似值。在此过程中,他们了解哪些方法和模式可以产生最完美的结果。

这对于语言翻译特别有效:经过训练,他们能够协调翻译文本中的短语,而不是逐字翻译。Facebook 研究人员将神经网络的这一特性视为解决符号数学问题的优势,而不是障碍。与传统计算机的僵化不同,它赋予程序解决问题的自由。

而这种自由对于一些开放式问题特别有用,比如集成问题。数学家有句古话:“微分是一门技术,积分是一门艺术”。换句话说,对一个函数求导只需要遵循一些明确定义的步骤;但是进行积分通常需要别的东西,在判断积分方法和求积分项的东西时,它需要接近人类直觉的东西,而不仅仅是计算。

图片[1]-如何让AI给出地道而不是的应用?(上)-老王博客

Facebook 的研究团队认为,这种直觉可以通过 AI 的模式识别来模拟。“积分是数学中最类似于​​模式识别的问题之一,”查顿说。因此,即使神经网络可能不知道函数是什么或变量的含义是什么,但它们会在对大量数据进行训练时产生一种本能,即神经网络将开始感受计算如何得到答案。

为了让神经网络像数学家一样处理数学符号,Charton 和 Lample 首先将数学表达式翻译成更有用的形式。通过“翻译”,他们最终将复杂的数学表达式翻译成神经网络可以识别的高效简化形式——树形图matlab神经网络结果怎么看,概括了表达式中的运算符号和数字。

其中,加减乘除等运算符号成为树形图的分支,表达式中的参数(变量和数字)成为叶子。通过转换为树状图,可以将复杂的数学表达式转化为嵌套在树状层中的简单操作,从而使神经网络能够识别和操作所需的简化表达式,并得到最终的准确结果。

Lample 说,这个过程与人们解决积分问题甚至所有数学问题的方式大致相似。所有这些都是通过经验将它们简化为先前由神经网络以复杂的数学表达式解决的子问题。

在构建了这个结构之后,研究人员使用一组基本函数生成了几个训练数据集,总计约 2 亿个(树形)方程和解。然后他们将训练数据交给神经网络,让神经网络对训练数据集中这样一个树状图的方程解有一个初步的了解。

训练结束后,是时候看看神经网络现在能做什么了。

计算机科学家给了它一个包含 5000 个方程的测试集,测试数据没有答案。令人惊讶的是,神经网络成功通过了测试:它成功地为绝大多数问题找到了正确的解,并且以高精度求解了方程组。它特别擅长集成,可以解决几乎 100% 的测试问题。然而,神经网络在求解常微分方程时表现不佳。

对于几乎所有问题,实验构建的程序可以在不到 1 秒的时间内生成正确的解决方案。尤其是对于集成问题,它比流行软件 Mathematica 和 Matlab 中的一些内置包更快更准确。Facebook 团队报告说,神经网络甚至可以回答两个软件无法解决的一些数学问题。

当然,这只是对未来的展望。但不用说,该团队回答了一个已经存在数十年的问题——人工智能可以做符号数学吗?答案是肯定的。他们在人工智能探索符号数学方面迈出了显着的一步。“他们真的设法建立了可以解决超出机器系统规则的问题的神经网络,”麦克莱兰说。

新模式初步探索的局限与展望

尽管有这些结果,但数学家、Mathematica 开发公司 Wolfram 的负责人 Roger Germundsson 表示反对,他说为了简单起见,该实验只使用了 Mathematica 的部分函数和神经网络。残酷的比较。这种比较仅限于 Mathematica 特定的指令,例如用于积分的“integrate”指令和用于求解微分方程的“DSolve”指令 – 但实际上,还有数百种其他方法和指令可以求解更复杂的方程。

Germundsson 还注意到,虽然实验中给出的训练数据集非常大,但所包含的方程都只有一个变量,并且只是用于设计初等函数的操作。“这种方程只是可能涉及的方程运算的一小部分,”他说。该神经网络不会测试物理和金融中经常使用的更复杂的函数,例如误差函数或贝塞尔函数。(作为回应,Facebook 团队表示,在以后的测试中,可能只需要在训练神经网络时对训练集进行一些非常简单的修改。)

加州大学圣巴巴拉分校的数学家 Frederic Gibou 研究过使用神经网络求解偏微分方程,他认为 Facebook 小组的神经网络不是绝对可靠的。“研究人员需要确信,如果神经网络可靠,它可以解决任何形式的方程。”

其他批评者指出,Facebook 小组的神经网络并没有真正理解数学,它更像是一个临时的猜想,而不是一个实际的解决方案。

尽管如此,反对者承认新方法是有用的。Germundsson 和 Gibou 相信神经网络将在下一代符号数学求解工具中占有一席之地——但它可能只是一个地方。“我认为这只是众多工具中的一种,” Germundsson 说。

另一个未解决的问题:没有人真正了解它们是如何工作的,这是神经网络开发中最令人头疼的方面。

在模式识别中,我们只需要在一端输入训练数据集,在另一端输出相应的预测数据集,但中间发生了什么没人知道,使得神经网络成为一个完美的学习器。它是否理解输入的公式和算法?还是只是按照指示逐步计算数字的过程?

对此,Charton 说:“我们知道数学是如何工作的,通过使用特定的数学问题作为测试matlab神经网络结果怎么看,看看神经网络在哪里成功,在哪里失败,我们可以了解神经网络是如何工作的。”

他和 Lample 计划将数学表达式输入他们的神经网络,并跟踪程序如何响应表达式的微小变化。映射输入的变化如何触发输出的变化可能有助于揭示神经网络的运作方式。

Zaremba 认为这是测试和确定神经网络是否合理以及它们是否真正理解所回答的问题的积极探索。“改变参数或数学问题的其他部分很容易——我们可以通过观察神经网络对改变后的方程的反应来了解它的行为方式。我们可能真的理解为什么,而不仅仅是方程的解。”

神经网络探索的另一个可能方向是自动定理生成器的发展。数学家越来越多地寻找使用人工智能生成新定理和证明的方法,尽管“这项技术没有取得太大进展,”兰普尔说。“这是我们正在努力的事情。”

Charton 至少以两种方式描述了他们的方法,以促进人工智能定理的发现。首先,它可以充当数学家的助手,通过识别已知猜想的模式来帮助解决现有问题;其次,机器可能会生成数学家错过的潜在可证明结果的列表。“我们相信,如果你能进行整合,你应该能够证明这一点,”他说。

参考:

Ornes, S. (nd)。符号数学最终屈服于神经网络。广达杂志。检索于 2020 年 5 月 27 日,来自模式识别。(nd)。卞兆奇、张学功主编。模式识别(第二版)。清华大学出版社,2004. 2020 年 5 月 27 日,来自

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论