中国工程院院士潘云和:视觉智能的发展重点是对视觉知识和多元知识表达的研究

4月25日至26日,2021人工智能与机器人国际研讨会在香港中文大学(深圳)举行。 60多位行业专家,围绕人工智能与机器人、5G、数字技术等话题,重点分享研究成果、探讨技术难题、交流创新见解,旨在为我国的技术挑战和关键应用提供信息目前面向人工智能和机器人领域。谜题找到解决方案。

26日上午,中国工程院院士潘云和出席会议并发表了“视觉智能五个重要问题”的主题演讲。潘云鹤在会上讨论了视觉知识表达、视觉识别、视觉形象思维模拟、视觉知识学习和多元知识表达等五个重要问题。进一步指出,视觉知识的独特优势在于综合图像生成能力、时空演化能力和图像展示能力。这些正是字符知识和深度神经网络所缺乏的。因此,对视觉知识和多元知识表示的研究是开发新的视觉智能的关键。

视觉智能的发展对人工智能至关重要

“视觉智能在第一波人工智能浪潮中发挥了非常重要的作用。”潘云和表示,原因在于图像识别技术不仅对人脸、文字、指纹、医学影像等识别准确率高,而且可以广泛应用,如智能汽车、安防监控、智能交通等。 ,都需要视觉智能的技术支持。

中科院发展战略根据技术因素对2018年中美人工智能企业进行分类。一共九大类,其中三类为基础技巧,六类为专业技巧,其中三分之二与视觉相关,三分之一与语言相关。

中国信息通信研究院也对工业人工智能做了进一步的分析,分析了20多个工业人工智能模型,最终发现它们主要使用了两类技术,一是深度学习,二是深度学习。另一个是知识图谱。底层的都用深度学习,上面的都用知识图谱。原因很简单,知识图谱不能满足底层要处理的视觉信息;在高层处理大量语言信息和文本信息的同时bp神经网络原理及其在字符 1 识别中的应用,可以使用知识图谱。因此,从人工智能的应用和人工智能产业的角度来看,视觉是非常重要的。

一位心理学家做了一个实验,发现人脑虽然看不到图像,但还是有很多图像的。这些视觉记忆在认知心理学中被称为“视觉图像”。 “我过去领导了一个重点项目,发现视觉心理意象实际上是图像识别的重要支撑。”潘云和说。

会场

关于视觉智能的 5 个重要问题

研究视觉智能时有五个重要问题。第一个问题是视觉知识表示。认知心理学实验证明,视觉知识不同于语言知识。它可以表达物体的空间形状、大小、颜色和纹理之间的关系,以及物体的运动、速度和时间关系。

图片[1]-中国工程院院士潘云和:视觉智能的发展重点是对视觉知识和多元知识表达的研究-老王博客

第二个问题是视觉识别。在人工智能诞生之初,模式识别已经成为一个重要的研究领域。图像和视频识别是模式识别中最重要的部分之一。早期的图像识别是利用数字图像处理技术从低到高、从局部到整体进行识别。但随着近年来深度神经网络的兴起,还有其他方式。深度神经网络具有许多优势,例如识别图像的能力和从识别数据中学习的能力。

第三个问题是视觉形象思维模拟。如何改变视觉形象,如何模拟变化,实际上是人类在工程活动中非常重要的一环。由于人类在进行工程活动之前需要进行设计和规划,因此需要在实际规划过程中模拟并修改一些实际计划。

潘云和演讲现场

第四个问题是视觉知识的学习。目前,计算机视觉已经开始研究从图像到图形的转换方法。除了设备bp神经网络原理及其在字符 1 识别中的应用,计算机视觉最重要的内容就是重构。我们希望更多的是关于知识和概念的重构。

第五个问题是多重知识表示。人工智能通过多种知识表达方式解决问题,包括知识图谱型、图像型、心智图型等。因此,“人工智能2.0”提出了两个新概念,即跨媒体智能和大数据智能。目的是促进多种知识表达的同时表达和使用。 “这可能是未来5-10年人工智能发展的重要方向。”潘云和说。

“对于这五个问题,视觉知识的表达和多元知识的表达是最重要的。一旦这两个问题解决了,其他三个问题就更容易解决了。”潘云和表示,视觉知识的独特性和形象性,人工智能的综合生成能力、时空比较能力和图像展示能力,正是人工智能所缺乏的。视觉知识和多元知识表达,是一片贫瘠、寒冷、潮湿、肥沃的“北大荒”,也是一片充满希望和值得探索的“无人区”。

会场

【记者】金永生

【作者】金永生

【来源】南方传媒集团南方+客户

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论